大文件怎樣實現快速上傳?
前言
大文件快速上傳的方案,相信你也有過了解,其實無非就是將 文件變小,也就是通過 壓縮文件資源 或者 文件資源分塊 後再上傳。
本文只介紹資源分塊上傳的方式,並且會通過 前端(vue3 + vite) 和 服務端(nodejs + koa2) 交互的方式,實現大文件分塊上傳的簡單功能.
梳理思路
問題 1:誰負責資源分塊?誰負責資源整合?
當然這個問題也很簡單,肯定是前端負責分塊,服務端負責整合.
問題 2:前端怎麼對資源進行分塊?
首先是選擇上傳的文件資源,接着就可以得到對應的文件對象 File,而 File.prototype.slice 方法可以實現資源的分塊,當然也有人說是 Blob.prototype.slice 方法,因爲 Blob.prototype.slice === File.prototype.slice
.
問題 3:服務端怎麼知道什麼時候要整合資源?如何保證資源整合的有序性?
由於前端會將資源分塊,然後單獨發送請求,也就是說,原來 1 個文件對應 1 個上傳請求,現在可能會變成 1 個文件對應 n 個上傳請求,所以前端可以基於 Promise.all 將這多個接口整合,上傳完成在發送一個合併的請求,通知服務端進行合併。
合併時可通過 nodejs 中的讀寫流(readStream/writeStream),將所有切片的流通過管道(pipe)輸入最終文件的流中。
在發送請求資源時,前端會定好每個文件對應的序號,並將當前分塊、序號以及文件 hash 等信息一起發送給服務端,服務端在進行合併時,通過序號進行依次合併即可。
問題 4:如果某個分塊的上傳請求失敗了,怎麼辦?
一旦服務端某個上傳請求失敗,會返回當前分塊失敗的信息,其中會包含文件名稱、文件 hash、分塊大小以及分塊序號等,前端拿到這些信息後可以進行重傳,同時考慮此時是否需要將 Promise.all 替換爲 Promise.allSettled 更方便.
前端部分
創建項目
通過 pnpm create vite
創建項目,對應文件目錄如下.
請求模塊
src/request.js 該文件就是針對 axios
進行簡單的封裝,如下:
import axios from "axios";
const baseURL = 'http://localhost:3001';
export const uploadFile = (url, formData, onUploadProgress = () => { }) => {
return axios({
method: 'post',
url,
baseURL,
headers: {
'Content-Type': 'multipart/form-data'
},
data: formData,
onUploadProgress
});
}
export const mergeChunks = (url, data) => {
return axios({
method: 'post',
url, baseURL,
headers: {
'Content-Type': 'application/json'
},
data
});
}
文件資源分塊
根據 DefualtChunkSize = 5 * 1024 * 1024
,即 5 MB ,來對文件進行資源分塊進行計算,通過 spark-md5[1] 根據文件內容計算出文件的 hash 值,方便做其他優化,比如:當 hash 值不變時,服務端沒有必要重複讀寫文件等.
// 獲取文件分塊
const getFileChunk = (file, chunkSize = DefualtChunkSize) => {
return new Promise((resovle) => {
let blobSlice = File.prototype.slice || File.prototype.mozSlice || File.prototype.webkitSlice,
chunks = Math.ceil(file.size / chunkSize),
currentChunk = 0,
spark = new SparkMD5.ArrayBuffer(),
fileReader = new FileReader();
fileReader.onload = function (e) {
console.log('read chunk nr', currentChunk + 1, 'of');
const chunk = e.target.result;
spark.append(chunk);
currentChunk++;
if (currentChunk < chunks) {
loadNext();
} else {
let fileHash = spark.end();
console.info('finished computed hash', fileHash);
resovle({ fileHash });
}
};
fileReader.onerror = function () {
console.warn('oops, something went wrong.');
};
function loadNext() {
let start = currentChunk * chunkSize,
end = ((start + chunkSize) >= file.size) ? file.size : start + chunkSize;
let chunk = blobSlice.call(file, start, end);
fileChunkList.value.push({ chunk, size: chunk.size, name: currFile.value.name });
fileReader.readAsArrayBuffer(chunk);
}
loadNext();
});
}
發送上傳請求和合並請求
通過 Promise.all
方法整合所以分塊的上傳請求,在所有分塊資源上傳完畢後,在 then
中發送合併請求.
// 上傳請求
const uploadChunks = (fileHash) => {
const requests = fileChunkList.value.map((item, index) => {
const formData = new FormData();
formData.append(`${currFile.value.name}-${fileHash}-${index}`, item.chunk);
formData.append("filename", currFile.value.name);
formData.append("hash", `${fileHash}-${index}`);
formData.append("fileHash", fileHash);
return uploadFile('/upload', formData, onUploadProgress(item));
});
Promise.all(requests).then(() => {
mergeChunks('/mergeChunks', { size: DefualtChunkSize, filename: currFile.value.name });
});
}
進度條數據
分塊進度數據利用 axios 中的 onUploadProgress 配置項獲取數據,通過使用 computed 根據分塊進度數據的變化自動自動計算當前文件的總進度.
// 總進度條
const totalPercentage = computed(() => {
if (!fileChunkList.value.length) return 0;
const loaded = fileChunkList.value
.map(item => item.size * item.percentage)
.reduce((curr, next) => curr + next);
return parseInt((loaded / currFile.value.size).toFixed(2));
})
// 分塊進度條
const onUploadProgress = (item) => (e) => {
item.percentage = parseInt(String((e.loaded / e.total) * 100));
}
服務端部分
搭建服務
-
使用 koa2 搭建簡單的服務,端口爲 3001
-
使用 koa-body 處理接收前端傳遞
'Content-Type': 'multipart/form-data'
類型的數據 -
使用 koa-router 註冊服務端路由
-
使用 koa2-cors 處理跨域問題
目錄 / 文件劃分
server/server.js
該文件是服務端具體的代碼實現,用於處理接收和整合分塊資源.
server/resources
該目錄是用於存放單文件的多個分塊,以及最後分塊整合後的資源:
-
分塊資源未合併時,會在該目錄下以當前文件名創建一個目錄,用於存放這個該文件相關的所有分塊
-
分塊資源需合併時,會讀取這個文件對應的目錄下的所有分塊資源,然後將它們整合成原文件
-
分塊資源合併完成,會刪除這個對應的文件目錄,只保留合併後的原文件,生成的文件名比真實文件名多一個
_
前綴,如原文件名"測試文件.txt"
對應合併後的文件名"_測試文件.txt"
接收分塊
使用 koa-body
中的 formidable
配置中的 onFileBegin
函數處理前端傳來的 FormData 中的文件資源,在前端處理對應分塊名時的格式爲:filename-fileHash-index
,所以這裏直接將分塊名拆分即可獲得對應的信息。
// 上傳請求
router.post(
'/upload',
// 處理文件 form-data 數據
koaBody({
multipart: true,
formidable: {
uploadDir: outputPath,
onFileBegin: (name, file) => {
const [filename, fileHash, index] = name.split('-');
const dir = path.join(outputPath, filename);
// 保存當前 chunk 信息,發生錯誤時進行返回
currChunk = {
filename,
fileHash,
index
};
// 檢查文件夾是否存在如果不存在則新建文件夾
if (!fs.existsSync(dir)) {
fs.mkdirSync(dir);
}
// 覆蓋文件存放的完整路徑
file.path = `${dir}/${fileHash}-${index}`;
},
onError: (error) => {
app.status = 400;
app.body = { code: 400, msg: "上傳失敗", data: currChunk };
return;
},
},
}),
// 處理響應
async (ctx) => {
ctx.set("Content-Type", "application/json");
ctx.body = JSON.stringify({
code: 2000,
message: 'upload successfully!'
});
});
整合分塊
通過文件名找到對應文件分塊目錄,使用 fs.readdirSync(chunkDir)
方法獲取對應目錄下所以分塊的命名,在通過 fs.createWriteStream/fs.createReadStream
創建可寫 / 可讀流,結合管道 pipe
將流整合在同一文件中,合併完成後通過 fs.rmdirSync(chunkDir)
刪除對應分塊目錄.
// 合併請求
router.post('/mergeChunks', async (ctx) => {
const { filename, size } = ctx.request.body;
// 合併 chunks
await mergeFileChunk(path.join(outputPath, '_' + filename), filename, size);
// 處理響應
ctx.set("Content-Type", "application/json");
ctx.body = JSON.stringify({
data: {
code: 2000,
filename,
size
},
message: 'merge chunks successful!'
});
});
// 通過管道處理流
const pipeStream = (path, writeStream) => {
return new Promise(resolve => {
const readStream = fs.createReadStream(path);
readStream.pipe(writeStream);
readStream.on("end", () => {
fs.unlinkSync(path);
resolve();
});
});
}
// 合併切片
const mergeFileChunk = async (filePath, filename, size) => {
const chunkDir = path.join(outputPath, filename);
const chunkPaths = fs.readdirSync(chunkDir);
if (!chunkPaths.length) return;
// 根據切片下標進行排序,否則直接讀取目錄的獲得的順序可能會錯亂
chunkPaths.sort((a, b) => a.split("-")[1] - b.split("-")[1]);
console.log("chunkPaths = ", chunkPaths);
await Promise.all(
chunkPaths.map((chunkPath, index) =>
pipeStream(
path.resolve(chunkDir, chunkPath),
// 指定位置創建可寫流
fs.createWriteStream(filePath, {
start: index * size,
end: (index + 1) * size
})
)
)
);
// 合併後刪除保存切片的目錄
fs.rmdirSync(chunkDir);
};
前端 & 服務端 交互
前端分塊上傳
測試文件信息:
選擇文件類型爲 19.8MB,而且上面設定默認分塊大小爲 5MB ,於是應該要分成 4 個分塊,即 4 個請求.
圖片過大,截圖處理
服務端分塊接收
前端發送合併請求
服務端合併分塊
擴展 —— 斷點續傳 & 秒傳
有了上面的核心邏輯之後,要實現斷點續傳和秒傳的功能,只需要在取擴展即可,這裏不再給出具體實現,只列出一些思路.
斷點續傳
斷點續傳其實就是讓請求可中斷,然後在接着上次中斷的位置繼續發送,此時要保存每個請求的實例對象,以便後期取消對應請求,並將取消的請求保存或者記錄原始分塊列表取消位置信息等,以便後期重新發起請求.
取消請求的幾種方式
-
如果使用原生 XHR 可使用
(new XMLHttpRequest()).abort()
取消請求 -
如果使用 axios 可使用
new CancelToken(function (cancel) {})
取消請求 -
如果使用 fetch 可使用
(new AbortController()).abort()
取消請求
秒傳
不要被這個名字給誤導了,其實所謂的秒傳就是不用傳,在正式發起上傳請求時,先發起一個檢查請求,這個請求會攜帶對應的文件 hash 給服務端,服務端負責查找是否存在一模一樣的文件 hash,如果存在此時直接複用這個文件資源即可,不需要前端在發起額外的上傳請求.
最後
前端分片上傳的內容單純從理論上來看其實還是容易理解的,但是實際自己去實現的時候還是會踩一些坑,比如服務端接收解析 formData 格式的數據時,沒法獲取文件的二進制數據等
參考資料
[1]
spark-md5 :https://www.npmjs.com/package/spark-md5
作者:熊的貓
鏈接:https://juejin.cn/post/7074534222748188685
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/GWbhoydThW6mvr8M9qWkDg