氣氛很好,不是壓力面,聊天似的。氣氛很好,不是壓力面,聊天似的。主要是關心了一下為啥不接著在滴滴實習要重新找工作。我大概說了一下是因為,干的活比較偏業務不是我理想中的data sci,然后他問了一下簡歷里面實習當中做的事情,也沒有啥,講了一下Python和SQL經歷,問了一下數據結構算法有關的知識,還有git,linux主要操作,數據結果問得多的是stack和queue,先進后出和先進先出,stack用于DFS比較多,還有linkedlist和arraylist的區別。排序算法原理和時間空間復雜度,快排平均nlgn最差n方,我回答的是基于partition,作為軸,兩邊分別比它大或者小。
之后有關feed steams,問了一下hive的底層原理。為什么sql可以直接hive讀取轉化,我說我只知道跟mapreduce有關,底層不清楚,面試官說沒關系。然后問了一下是不是用過spark,我說spark通過Python接口用過,而且是數據量特別大的時候才用。用過pyspark的MLlib搭建過pipeline。面試官問了一下上次實習寫的代碼量,我說主要以sql和python為主,python主要以pandas matplotlib為主,大概幾千行吧。但是很多都是改來改去重復的。接下來在線寫代碼,給了一個鏈接是共享doc,有點像google docs,中文版的,石墨文檔。
1、排序數組= {4,1,2,3,6,3,10,9}我用Python裝的經典算法導論的實現,基于partition 最后解釋了一下partition函數的作用,linear selection time,最后給了unit test;
2、二叉樹后序遍歷用了兩種實現,一種是基于recursion,一種是基于兩個stack改造成的。
寫完之后面試官讓解釋了一下思路,這個思想是劍指offer里面提到過的,倆queue模擬stack, 倆stack模擬queue,stack1存到stack2然后再pop一次就是后序遍歷了。寫完代碼之后面試官講了team里的業務,主要負責feed streams的選擇推送,相似度計算,協同算法,基于用戶,基于物品。技術棧是JAVA Scala 框架Spring,實時推薦為主,基于數據,用戶feed streams內容導向涉及到NLP,不需要給文本打標簽,有專門的標簽團隊,在線離線推薦都有。
之后講了一下實習地點。光谷金融港,好遠。早上9.30 晚上8點左右,不強制打卡,沒有食堂,附近有吃的。面試官說一面他這里是沒有問題,后面是HR的問題,因為我六月才回來,所以到時候跟進headcount。
面試感受:一般;面試難度:簡單;面試來源:網絡招聘