本人熟悉python,了解c++,opencv,tensorflow,pytorch,理解并熟悉cnn,dnn,元學習,強化學習的數(shù)學原理。做過的項目包括,自動閱卷系統(tǒng),特定情況下的人臉生成,圖像清晰化,人臉檢測和關(guān)鍵點的檢測,人臉語意分割,人臉老化,人臉多屬性分類,頭皮多屬性分類。從而理解并熟悉了ocr,gan,超像素,目標檢測,圖像語義分割等方法。
眼睛眼瞼處瞼板腺的檢測,具體如下:
第一步,和同事討論制定眼瞼和瞼板腺的標準,就是要把圖像中眼瞼和瞼板腺分別識別出來然后進行標記,并制作數(shù)據(jù)集
第二步,制作數(shù)據(jù)集,數(shù)據(jù)集一共有接近2000張圖像
第三步,使用語義分割加遷移學習的方法,基于這個任務的特殊性,使用二分類的sig函數(shù)做一個loss函數(shù)。
第四步,確定閾值,對每個類別的召回率和準確率進行分析,使得模型的召回率和準確率都達到合理的要求。
最終進行將模型轉(zhuǎn)化為c++可調(diào)用的api
這個項目主要是實現(xiàn)基于q-lreaning的深度學習的方法去訓練飛行的小鳥,盡可能的使得小鳥飛的更遠,我負責算法的原型設計和代碼程序的實現(xiàn)。最終,可以實現(xiàn)飛行的小鳥進行長時間的飛行。
這個項目主要是實現(xiàn)在會議系統(tǒng)中的語音降噪,是一種在嵌入式設備中運行的算法,主要特點是算法的運行速度快,同時精度高,對于場景的適用性高,可以實現(xiàn)對十多種噪音的有效壓制。我負責算法的原型設計,訓練和模型的部署。
這個項目主要是實現(xiàn)人臉定位和關(guān)鍵點定位,算法的泛化能力前,對于各種人臉偏置的情況,算法同樣也可以實現(xiàn)一個很好的識別和定位。我主要負責算法原型的設置,訓練和部署