沒想到,Python 還可以製作 Web 可視化頁面!

一談到 Web 頁面,可能大家首先想到就是 HTML,CSS 或 JavaScript。

本次小 F 就給大家介紹一下如何用 Python 製作一個數據可視化網頁,使用到的是 Streamlit 庫。

輕鬆的將一個 Excel 數據文件轉換爲一個 Web 頁面,提供給所有人在線查看。

每當你對 Excel 文件進行更改保存,Web 頁面還能夠實時進行更新,確實挺不錯的。

Streamlit 的文檔和教程地址如下。

https://docs.streamlit.io/en/stable/

https://streamlit.io/gallery

相關的 API 使用可以去文檔中查看,都有詳細的解釋。

項目一共有三個文件,程序、圖片、Excel 表格數據。

數據情況如下,某公司年底問卷調查 (虛構數據),各相關部門對生產部門在工作協作上的打分情況。

有效數據總計約 676 條,匿名問卷,包含問卷填寫人所屬部門,年齡,評分。

最後對各部門參與人數進行彙總計數 (右側數據)。

首先來安裝一下相關的 Python 庫,使用百度源。

# 安裝streamlit
pip install streamlit -i https://mirror.baidu.com/pypi/simple/

# 安裝Plotly Express
pip install plotly_express==0.4.0 -i https://mirror.baidu.com/pypi/simple/

# 安裝xlrd
pip install xlrd==1.2.0 -i https://mirror.baidu.com/pypi/simple/

因爲我們的數據文件是 xlsx 格式,最新版的 xlrd,只支持 xls 文件。

所以需要指定 xlrd 版本爲 1.2.0,這樣 pandas 才能成功讀取數據。

命令行終端啓動網頁。

# 命令行終端打開文件所在路徑
cd Excel_Webapp

# 運行網頁
streamlit run app.py

成功以後會有提示,並且瀏覽器會自動彈出網頁。

如果沒有自動彈出,可以直接訪問上圖中的地址。

得到結果如下,一個數據可視化網頁出來了。

目前只能在本地訪問查看,如果你想放在網上,可以通過服務器部署,需要自行去研究~

下面我們來看看具體的代碼吧。

import pandas as pd
import streamlit as st
import plotly.express as px
from PIL import Image

# 設置網頁名稱
st.set_page_config(page_title='調查結果')
# 設置網頁標題
st.header('2020年調查問卷')
# 設置網頁子標題
st.subheader('2020年各部門對生產部的評分情況')

導入相關的 Python 包,pandas 處理數據,streamlit 用來生成網頁,plotly.express 則是生成圖表,PIL 讀取圖片。

設置了網頁名稱,以及網頁裏的標題和子標題。

# 讀取數據
excel_file = '各部門對生產部的評分情況.xlsx'
sheet_name = 'DATA'

df = pd.read_excel(excel_file,
                   sheet_name=sheet_name,
                   usecols='B:D',
                   header=3)

# 此處爲各部門參加問卷調查人數
df_participants = pd.read_excel(excel_file,
                                sheet_name=sheet_name,
                                usecols='F:G',
                                header=3)
df_participants.dropna(inplace=True)

# streamlit的多重選擇(選項數據)
department = df['部門'].unique().tolist()
# streamlit的滑動條(年齡數據)
ages = df['年齡'].unique().tolist()

讀取 Excel 表格數據,並且得出年齡分佈以及部門情況,一共是有 5 個部門。

添加滑動條和多重選擇的數據選項。

# 滑動條, 最大值、最小值、區間值
age_selection = st.slider('年齡:',
                          min_value=min(ages),
                          max_value=max(ages),
                          value=(min(ages), max(ages)))

# 多重選擇, 默認全選
department_selection = st.multiselect('部門:',
                                      department,
                                      default=department)

結果如下。

年齡是從 23 至 65,部門則是市場、物流、採購、銷售、財務這幾個。

由於滑動條和多重選擇是可變的,需要根據過濾條件得出最終數據。

# 根據選擇過濾數據
mask = (df['年齡'].between(*age_selection)) & (df['部門'].isin(department_selection))
number_of_result = df[mask].shape[0]

# 根據篩選條件, 得到有效數據
st.markdown(f'*有效數據: {number_of_result}*')

# 根據選擇分組數據
df_grouped = df[mask].groupby(by=['評分']).count()[['年齡']]
df_grouped = df_grouped.rename(columns={'年齡''計數'})
df_grouped = df_grouped.reset_index()

得到數據便可以繪製柱狀圖了。

# 繪製柱狀圖, 配置相關參數
bar_chart = px.bar(df_grouped,
                   x='評分',
                   y='計數',
                   text='計數',
                   color_discrete_sequence=['#F63366']*len(df_grouped),
                   template='plotly_white')
st.plotly_chart(bar_chart)

使用 plotly 繪製柱狀圖。

當我們在網頁調整選項時,有效數據和柱狀圖也會隨之變化。

此外 streamlit 還可以給網頁添加圖片和交互式表格。

# 添加圖片和交互式表格
col1, col2 = st.beta_columns(2)
image = Image.open('survey.jpg')
col1.image(image,
           caption='Designed by 小F / 法納斯特',
           use_column_width=True)
col2.dataframe(df[mask]width=300)

得到結果如下。

可以看到表格有一個滑動條,可以使用鼠標滾輪滾動查看。

最後便是繪製一個餅圖啦!

# 繪製餅圖
pie_chart = px.pie(df_participants,
                   title='總的參加人數',
                   values='人數',
                   names='公司部門')
st.plotly_chart(pie_chart)

結果如下。

各部門參加問卷調查的人數,也是一個可以交互的圖表。

將銷售、市場、物流取消掉,我們就能看出財務和採購參加問卷調查的人數佔比情況。

好了,本期的分享就到此結束了,有興趣的小夥伴可以自行去實踐學習。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/7Ljbyaw7RqtOnlzB0cOsAw