螞蟻開源,又一超棒的 Python 開源可視化庫

人生苦短,快學 Python!

給大家推薦的這個開源項目是一個非常棒的可視化庫 -- PyG2Plot 。

PyG2Plot 可視化

這個 Python 可視化新秀,在 GitHub 上是這樣介紹的:

🎨 PyG2Plot 是@AntV/G2Plot 在 Python3 上的封裝。G2Plot 是一套簡單、易用、並具備一定擴展能力和組合能力的統計圖表庫,基於圖形語法理論搭建而成。

不過研究PyG2Plot還得先從G2開始講,它是螞蟻金服開源一個基於圖形語法,面向數據分析的統計圖表引擎。後來又在其基礎上,封裝出業務上常用的統計圖表庫——G2Plot

不過現在 Python 這麼熱,幾乎每一個 nb 的前端可視化庫,最終都會被用 python 開發一套生成相應 html 的庫!它也不例外,封裝出了 Python 可視化庫——PyG2Plot

在 GitHub 上,也提供了一張示例圖,我對右下角的散點圖比較感興趣。

結果興致勃勃地去看示例,這簡直買家秀與賣家秀啊!

我不管,我就要右邊那個👉

自己動手,豐衣足食

看來還是需要自己動手,那就先安裝PyG2Plot庫吧

pip install pyg2plot

目前目前 pyg2plot 只提供簡單的一個 API,只列出需要的參數

  1. Plot(plot_type: str): 獲取 Plot 對應的類實例。

  2. plot.set_options(options: object): 給圖表實例設置一個 G2Plot 圖形的配置。

  3. plot.render(path, env, **kwargs): 渲染出一個 HTML 文件,同時可以傳入文件的路徑,以及 jinja2 env 和 kwargs 參數。

  4. plot.render_notebook(env, **kwargs): 將圖形渲染到 jupyter 的預覽。

於是我們可以先導入 Plot 方法

from pyg2plot import Plot

我們要畫散點圖

scatter = Plot("Scatter")

下一步就是要獲取數據和設置參數plot.set_options(),這裏獲取數據直接利用requset解析案例 json,而參數讓我在後面一一道來:

import requests

#請求地址
url = "https://gw.alipayobjects.com/os/bmw-prod/0b37279d-1674-42b4-b285-29683747ad9a.json"

#發送get請求
a = requests.get(url)

#獲取返回的json數據,並賦值給data
data = a.json()

成功獲取解析好的對象集合數據。

下面是對着參數,一頓操作猛如虎:

scatter.set_options(
{
    'appendPadding': 30,
    'data': data,
    'xField': 'change in female rate',
    'yField': 'change in male rate',
    'sizeField': 'pop',
    'colorField': 'continent',
    'color': ['#ffd500', '#82cab2', '#193442', '#d18768','#7e827a'],
    'size': [4, 30],
    'shape': 'circle',
    'pointStyle':{'fillOpacity': 0.8,'stroke': '#bbb'},
    'xAxis':{'line':{'style':{'stroke': '#aaa'}},},
    'yAxis':{'line':{'style':{'stroke': '#aaa'}},},
    'quadrant':{
        'xBaseline': 0,
        'yBaseline': 0,
        'labels': [
        {'content': 'Male decrease,\nfemale increase'},
        {'content': 'Female decrease,\nmale increase'},
        {'content': 'Female & male decrease'},
        {'content': 'Female &\n male increase'}, ],},
})

如果在Jupyter notebook中預覽的話,則執行下方語句

scatter.render_notebook()

如果想渲染出完整的html的話,則執行下方語句

scatter.render("散點圖.html")

看一下成果吧

參數解析 & 完整代碼

各位看官,這塊可能比較無聊,可以直接劃到文末或者點擊收藏。

主要還是詳解一下剛纔scatter.set_options()裏的參數,方便大家後續自己改造!

分成幾個部分一點一點解釋:

參數解釋

'appendPadding': 30, #①
'data': data, #②
'xField''change in female rate'#③
'yField''change in male rate',

①圖表在上右下左的間距,加不加這個參數具體看下圖

②設置圖表數據源(其中 data 在前面已經賦值了),這裏的數據源爲對象集合,例如:[{time: '1991',value: 20}, { time: '1992',value: 20 }]。

xFieldyField這兩個參數分別是橫 / 縱向的座標軸對應的字段。

參數解釋

'sizeField': 'pop', #④
'colorField': 'continent', #⑤
'color': ['#ffd500', '#82cab2', '#193442', '#d18768','#7e827a'], #⑥
'size': [4, 30], #⑦
'shape': 'circle', #⑧

④指定散點大小對應的字段名,我們用的pop(人口)字段。

⑤指定散點顏色對應的字段名,我們用的continent(洲)字段。

⑥設置散點的顏色,指定了系列色值。

⑦設置散點的大小,可以指定大小數組 [minSize, maxSize]

⑧設置點的形狀,比如ciclesquare

參數解釋

'pointStyle':{'fillOpacity': 0.8,'stroke': '#bbb'}, #⑨
'xAxis':{'line':{'style':{'stroke': '#aaa'}},}, #⑩
'yAxis':{'line':{'style':{'stroke': '#aaa'}},},

pointStyle是指折線樣式,不過在散點圖裏,指的是散點的描邊。另外fillOpacity是設置透明度,stroke是設置描邊顏色。

⑩這裏只是設置了座標軸線的顏色。

參數解釋

'quadrant':{
    'xBaseline': 0,
    'yBaseline': 0,
    'labels': [
    {'content': 'Male decrease,\nfemale increase'},
    {'content': 'Female decrease,\nmale increase'},
    {'content': 'Female & male decrease'},
    {'content': 'Female &\n male increase'}, ],},

quadrant是四象限組件,具體細分配置如下:

IOP9vQ

PyG2Plot的介紹文檔還不完善,上文中的很多參數是摸索的,大家作爲參考就好。

PyG2Plot 原理其實非常簡單,其中借鑑了 pyecharts 的實現,但是因爲螞蟻金服的 G2Plot 完全基於可視分析理論的配置式結構,所以封裝上比 pyecharts 簡潔非常非常多。

完整代碼

如果有小夥伴對本文代碼感興趣,關注「快學 Python」後臺回覆 “PyG2Plot” ,建議直接複製,即可獲取本文全部代碼!

快學 Python Python 可視化、自動化辦公、數據分析、爬蟲、Web 開發!人生苦短,快學 Python!

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/wDLmUAT3l8ILpUfMKnLDGQ