Dolt 用 Git 操作的數據庫?
Git 是一個開源的分佈式版本控制系統,可以敏捷高效地管理代碼,讓項目代碼支持同時存在多個不同的版本和分支,是程序員在項目開發中的必備工具。
版本控制
除了代碼文件可以進行版本控制之外,數據其實也可以版本控制!
今天,Dolt 項目榮登 GitHub 趨勢榜榜首,該倉庫的介紹是 “Git for Data”,一個面向數據的 Git,目前已收穫了幾千個 star。
GitHub 趨勢
下面我們來簡單瞭解下 Dolt 項目。
什麼是 Dolt?
根據官方介紹,Dolt 是一個基於 Git 協議的開源 SQL 數據庫,使用 Golang 語言編寫。
首先它和 MySQL 關係型數據庫一樣,用於存儲和管理數據,具有表、視圖等概念,支持數據的增刪改查等操作。
對 Dolt 執行數據庫操作
然而更棒的是,它提供了一個命令行工具,完美支持所有的 Git 命令,並且語法完全相同!允許用戶像使用一個 git 倉庫一樣對數據進行 fork、clone、branch、merge、push 和 pull 等操作。
Dolt 命令行
當你提交數據到存儲庫時,Dolt 會自動存儲提交日誌,比如本次修改的內容、作者、提交時間等,從而實現了對數據單元的版本控制,便於多人對數據進行協作和優化。
Dolt 日誌
比如一個班的同學在使用公共數據做實驗時,可能需要針對實驗提供不同的數據,這個時候就可以用 Dolt 來進行數據的版本控制。
數據版本控制
你還可以隨時查看上次提交的數據與當前數據的區別,一旦有人不小心把公共數據改錯了,發現當前數據有異常時,可以輕鬆地回滾和修復問題。
查看不同版本的數據區別
Dolt 簡直就是 Git 和 MySQL 的孩子!
這也不像啊
關於 Dolt 的使用方法,官方已經給了詳細的教程,還是比較簡單的。
DoltHub
就像 Git 擁有 GitHub 作爲代碼的開源遠程託管平臺一樣,Dolt 官方也提供了相應的遠程託管平臺,即 DoltHub。
DoltHub 允許用戶將自己的 Dolt 數據庫免費託管到他們提供的雲存儲服務中,便於管理和協作。你可以像瀏覽 GitHub 一樣瀏覽 DoltHub,在這裏發現優秀的數據集,比如 Coronavirus(冠狀病毒)、Google Open Images 等,拿去實驗和數據分析都是極好的!
DoltHub
雖然數據版本控制的概念在很早之前就已經被提出和落地,但是 Dolt 的熱門應該能夠幫助更多同學瞭解和使用這類系統,我還是很期待他的發展。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/iUj66LnXjXKn361q6EWwcA