首頁 > 軟體

裝上這個外掛,不用寫code 就能用Python 做資料分析!

2021-03-09 19:30:05

Python 語法簡單好寫,背後社群強大,在資料分析領域佔有一席之地,甚至現在許多開源軟體和套件,也大多以Python 作為主要的實作語言。

Python 市場廣大、工作機會多,吸引許多非程式背景的人學習,但「寫」程式碼對於零基礎的初學者而言還是有些門檻,有什麼無痛接軌的工具嗎?

目前有個叫Mito 的外掛程式,操作上和Excel 一樣簡單,不用「寫」程式碼就能用Python 做資料分析,能協助程式設計初學者銜接學習 Python。

載入一個Jupyter 外掛後,無需寫程式碼就能做資料分析,還幫你生成相應程式?

沒錯,只需要下載這個名為Mito 的小工具包,用Python 做資料分析,變得和用Excel 一樣簡單:

運行速度比Excel 更快,也不需要到處搜各種Python 教學了。

和Excel 一樣直覺好用,而且更快更全面

Mito 是Jupyter notebook 的一個可編輯電子表格外掛,在編輯.csv 表格(帶格式轉換功能)時,就能生成相關Python 程式。

Mito,是粒線體Mitochondria 的縮寫。具體來說,Mito 的出現,像是將Python 的強大功能和Excel 的易用性進行了結合。

只需要掌握Excel 的用法,就能使用Python 的資料分析功能,還能將寫出來的程式「打包帶走」。

它彌補了Excel 在資料分析上的幾個缺陷:

Excel 無法做大資料分析(大型資料集處理得不好)Excel 運行緩慢Excel 無法輕鬆創建可重複流程同時,又比SQL 和Python 更簡單、直觀。畢竟這些專業工具對於0 基礎初學者來說,需要至少幾年時間,才能完全上手。

據Mito 內測使用者表示,這款外掛讓他們用Python 做資料分析的效率提升了10 倍,因為使用者可以直接在Mito 裡編寫Excel 公式,如=SUM(A1, 100)。

那麼,Mito 是怎麼做到將Excel 邏輯轉換成Python 程式的呢?

作者們編寫了一種名為Transpiler 的程式,有點類似於編譯器的功能,採用抽象語法樹(AST),解析Excel 原始碼,並轉換成Python 的原始碼。

相比於採用專業軟體如Alteryx(需要5000 美元/月)進行資料分析,Mito 所生成的Python 程式碼可以根據需要自行修改,靈活性更高一點。

目前,Mito 採用亞馬遜雲端平臺 (AWS)儲存使用者的相關資料,每個使用者擁有一個獨立賬戶。

當然,使用者也可以選擇將資料儲存在本地。

還能自動生成Python 程式碼

以分析美國各州的「家庭平均收入」和「允許託運的火車站數量」這兩個資料的關係為例。

首先,上傳「家庭平均收入」和「允許託運的火車站數量」兩份資料。

資料處理的格式是.csv,當然也可以輸入Excel 檔案,並用Mito 轉成兩份.csv 檔案。

然後,將這兩份資料集合並在一起,只需要用滑鼠勾選對應功能、選中相關資料列就行。

啪!程式碼就生成好了。

然後,是做資料透視表,在完成分組後,採用聚合(aggregate)功能來切換聚合方法。

還包括資料過濾功能,同樣立刻就能生成相關程式碼。

包含升降序排序功能,快速簡潔。

然後就是相關資料統計、分析出結果了,流程直觀。

儲存分析檔案的方法也很簡單,檔案是以Python 編寫的,而不是用比較難懂的VBA。

要想重複上面的步驟的話,也非常容易,Mito 自帶「重複已儲存分析步驟」功能,一鍵就能用同樣的方法分析其他資料。

確實要比一行行編寫程式碼簡單多了。

是誰開發了Mito?

那麼,Mito 的作者們,為什麼要搞這個軟體?

因為他們發現,所謂的「幾天上手Python 資料分析」,其實根本沒有那麼容易……

初學者要想用Python 搞資料分析,就得不停地檢視各種文件、和求助StackOverflow。

要想真正快速用Python 分析資料,最後還得自己編寫軟體。

三位作者Aaron Diamond-Reivich、Jake Diamond-Reivich 和Nate Rush 都來自賓大,在學校期間,他們學習了電腦科學、統計學和商業分析相關的課程。

也正是在搞資料分析的時候,他們萌生了想要製作Mito 的想法。

作者表示,軟體目前還沒有開源,因為他們還在思考,如何支援維護這個項目,並轉到開源路徑上來。

不過,它現在已經可以使用了。

感興趣的小夥伴們,可以上手試試了!

#python#


IT145.com E-mail:sddin#qq.com