字節跳動 NLP 算法面試題整理
大家好,這裏是面經醬~
今天來幫大家梳理網上公開面經中提到的阿里 NLP 算法崗相關面試題,歡迎在 面經醬 (www.mjj666.cn) 搜索最新面經,有其他公司、崗位的面經梳理需求請留言哦~
編程 & 數學基礎
-
【高頻】Topk
-
三叉樹遍歷
-
求一個大於等於輸入的正整數的最小降序序列
-
快排
-
提取有效的 ip 地址
-
【高頻】貪心和 DP 的區別
-
給定 x 種硬幣,湊齊 y 元
-
給 100 億個數據,找到中位數
-
有序含重複值數組找某個值第一次出現的位置
-
最長重複子序列
-
DP 的一般做法流程
-
海量商家和海量語料,語料不平衡,語料對商家 group by 後按照時間排序
-
全排列
-
概率題:甲乙扔骰子,獲勝概率相同,投 10 次,已經 5 次了,甲已經贏了 3 次,問甲獲勝概率
-
概率題,三個硬幣,一個硬幣兩面人頭,一個硬幣一面人頭一面數字,一個硬幣兩面數字,問隨機拿去一個硬幣,其中人頭向上,問另一面人頭也向上概率
-
智力題:倒水問題
-
Python 垃圾回收
-
Python 列表合併
-
Linux 多個進程如何通信
-
進程和線程區別
-
Linux debug
項目深度
-
文本生成評估指標,BLUE 的缺點
-
爲什麼使用 lightGBM,比起 xgboost 的優點是什麼
-
【高頻】樣本不均衡
-
長文本的處理
-
引入詞向量的相似性對於結果有什麼不好的影響
-
如何引入知識圖譜
-
詞向量中很稀疏和出現未登錄詞,如何處理
-
解碼策略
-
爲什麼要用深度學習,不用傳統方法
-
kmeans 的 k 怎麼選擇
-
新詞發現怎麼做
基礎知識
-
HMM
-
FM
-
Wide&Deep
-
【高頻】預訓練模型:Transformer、BERT、UniLM 等模型細節(時間複雜度)、優缺點
-
語言模型的公式
-
Self-attention 和 attention 的區別
-
transformer 爲什麼用 + 不用 concat
-
Attention、Mask 的使用
-
位置編碼
-
Seq2seq 結構
-
BN、LN 區別,在 inference 時如何處理
-
手撕 LSTM
-
Word Piece
-
線性和非線性之間的關係
-
DSSM 以及改進
-
樹模型和深度學習的區別
-
【高頻】梯度爆炸怎麼解決
-
最小二乘法的推導、本質,和極大似然的關係
-
對 epcho 做 shuffle,類似於一種優化器
-
優化器,什麼情況下不適用動量優化器
-
【高頻】防止過擬合的方法
-
【高頻】決策樹和 GBDT 區別
-
交叉熵的損失函數
-
GDBT 如何抑制樹的不斷增長
-
xgboost 如何做分類
-
mse 和交叉熵的區別
-
lr 模型:如何做特徵交叉、緩解過擬合、和 svm 的區別
-
Sigmoid、Tanh 函數與導數
-
Sigmoid 和 ReLU 的區別
-
【高頻】Dropout 作用、原理、實現
-
PCA 原理及涉及的公式
-
L1,L2 正則化
-
LSTM 和 RNN 的結構、解決的問題
-
sigmoid 當數據太大的時候不敏感怎麼辦
-
bagging、boosting
-
熵的定義、公式
-
cnn 的卷積計算,參數計算
開放題
-
若有個電子病歷數據,能識別多少種類型的實體
-
如何根據商品評論,生成商品的描述
-
文本生成:一對多訓練如何訓練
-
文本匹配常見架構
-
因果詞向量的應用場景
-
項目初期,10w 短文本,如何用無監督做分類
-
減輕特徵工程的手段
-
【高頻】平時逛過哪些有關 NLP 的論壇
-
說幾個兩年之內的前沿技術
-
導師覺得你最大的優點和缺點
-
想做一個什麼樣的人
-
對阿里的理解
-
研究生最大的收穫
-
舉一個例子說明遇到的最大的困難
-
介紹你做的最好的一篇論文以及創新點
-
當碰到難題時,團隊士氣低落的時候,作爲團隊的一員,該怎麼做
-
對推薦系統理解
-
【高頻】研究生期間的研究方向
參考資料
-
NLP 面試覆盤 | 阿里 / 騰訊 / 頭條 / paypal / 快手: https://blog.csdn.net/abcdefg90876/article/details/107398761
-
【面試通關篇】NLP 面經集結 | 達摩院、騰訊、微軟、美團、百度: https://blog.csdn.net/hecongqing/article/details/106010267
-
暑期實習面經 (NLP 方向) 達摩院、騰訊、微軟、美團、百度: http://www.baidu.com/link?url=gYEOOVPm9H1wSuDYt49LzT4EPN9aKmw4KlXM4cS6qf7VzIT2mkypYxSAErez9r6NXntdoS5jj17TfMmxvGwS8nrqQBn5rBu6Hn1VFkaNALW
-
阿里面經 - 達摩院自然語言處理實習生 (已拿到意向書): https://blog.csdn.net/weixin_42018581/article/details/106376403
-
NLP 實習面試經歷 (小米、去哪兒、美團、三角獸、愛奇藝、阿里): https://blog.csdn.net/wqy20140101/article/details/88092741
-
阿里 NLP 三面涼經: https://www.nowcoder.com/discuss/180499
-
阿里面經 - 達摩院自然語言處理實習生(已拿到意向書): https://www.nowcoder.com/discuss/432536
-
阿里達摩院 NLP 面經: https://www.nowcoder.com/discuss/424692
-
阿里達摩院 NLP 二面涼經: https://www.nowcoder.com/discuss/402085
-
暑期實習面經(NLP 方向)達摩院、騰訊、微軟、美團、百度精: https://www.nowcoder.com/discuss/414566
-
阿里國際事業部 NLP 算法面經: https://www.nowcoder.com/discuss/89133
-
阿里自然語言處理崗線上面經: https://www.nowcoder.com/discuss/226159
-
阿里巴巴面經 - NLP: https://www.nowcoder.com/discuss/279013
-
3.26 阿里健康 NLP 暑期實習崗一面: https://www.nowcoder.com/discuss/625107
-
騰訊 / 阿里 / 攜程 詳細 NLP 算法實習面經: https://www.nowcoder.com/discuss/639224
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/ypHlJLG6HsTZckuLeQA-Ew