国产精品99一区二区三_免费中文日韩_国产在线精品一区二区_日本成人手机在线

新華網 正文
數據工廠里的年輕人
2018-07-08 09:13:27 來源: 解放日報
關注新華網
微博
Qzone
評論
圖集

  數據標注是一項枯燥的工作,不少數據標注員喜歡戴著耳機聽音樂。向凱 攝

  在上海徐家匯一家廣告公司做文案的索琳,從未想過自己也能參與打磨人工智能的應用。她最近接到任務,教一位只存在于手機應用程序里的“老爺爺”與用戶對話。比如,當用戶問“世界上誰最美”,他就會回答“當然是你最美”。一問一答均由索琳事先寫好,再由一家擅長語音識別的人工智能(AI)公司植入。索琳編寫了近3000條問答,一心想把“老爺爺”培養得更風趣、睿智。不過,實際上她只是提供了最基礎的數據。

  一千多公里之外的貴州惠水縣百鳥河數字小鎮,一家提供數據服務的公司,22歲的吳潘威正對著電腦用鼠標“貼標簽”:將一張普通道路交通圖中的機動車、行人、非機動車逐一框中……和索琳教機器對話一樣,吳潘威貼標簽的目的是教人工智能看圖識物,他們被叫作“數據標注員”。

  當前,以互聯網、大數據、人工智能為代表的新一代信息技術日新月異。人工智能在去年、今年兩度被寫入政府工作報告;而大數據,已經成為世界認識貴州的新名片。在脫貧攻堅主戰場的貴州,大數據的經濟增速已連續7年位居全國前列。

  產業勃興,數據標注員因此成為新興職業。多名業內人士告訴記者,目前國內至少有大小近千家標注公司,共20余萬名數據標注員。

  在百鳥河數字小鎮,僅吳潘威所在的夢動科技有限公司就有400多名標注員。他們是踩著信息技術浪潮的流水線工人。

  “教機器認識這個世界”

  這是一張微笑的普通女性的臉,她的鼻子、嘴巴、眼睛、眉毛和臉部輪廓布滿了點,一共有149個,它們被叫做“人臉關鍵點”。

  在百鳥河數字小鎮,吳潘威與同事們坐在電腦前,將圖片放大,用鼠標移動這些小點,使它們落在合適的位置。吳潘威瀏覽了成千上萬張人臉圖片,在他的眼中,這些人臉沒有膚色、性別、老少之分,只有清晰與模糊的區別,一張像是從監控攝像里截取的模糊圖片會讓他多花幾倍時間。

  人工智能本身不會識別物體,而要依靠海量訓練。當人臉關鍵點被一一標注之后,計算機才能建立起對人臉的認知。而人臉關鍵點的數目并不固定,不同數目的背后連接的是不同的算法。“吳潘威們”只需按照人工智能工程師們設定的數目規范來標注。換言之,這些數據標注員并不需要了解算法之復雜,他們所做的,更像在工廠流水線重復作業。

  百度無人駕駛汽車,是夢動科技接手的第一個項目。公司人工智能服務部總監曾蕓說:“剛接到無人車項目時,我們所有人都是蒙的,覺得這個事情不大靠譜,畢竟無人駕駛在我們眼里是高精尖的科技。”

  2016年5月,百度派技術人員來開講座,開誠布公——“你們就是在訓導機器,教機器認識這個世界。”那時,所有人都不知道有“數據標注員”這個職業,吳潘威和一起實習的小伙伴們互相稱呼“畫框的”。

  可不就是“畫框的”?幾十個人坐在電腦前按動鼠標畫框,機動車分成大型車、小型車,非機動車分成自行車、摩托車、三輪車,還有行人、交通信號燈,都要一一框起來。

  “標注員都是‘滾雪球’帶教帶出來的,那時一個人一天要畫幾百個框,以至于后來走在路上看什么東西都想畫個框把它框住。”曾蕓回憶說。

  “后來,看到無人駕駛汽車在美國的硅谷跑,在烏鎮的世界互聯網大會跑,說實話還是蠻振奮的。”吳潘威靦腆地笑著說,不管科技有多先進,至少無人車里出現的路況掃描圖像他是熟悉的,“也許那就是我之前標注過的。”

  那種感覺,就像一不小心踩到了時代潮流的浪尖上。

  “指數級增長”

  吳潘威是貴州盛華職業學院新近畢業的大學生,2016年初到夢動科技當實習生。在這里,一間辦公室大約能容納60名數據標注員,每張辦公桌后面都藏著一張稚嫩的臉,幾乎每個人都戴著耳機聽音樂,同時不停地切換圖片、移動鼠標,在屏幕上打點或者畫框。

  他們大多是像吳潘威一樣年輕的大學生。除了盛華職業學院,還有來自黔南民族醫學高等專科學校等4所學校的實習生。

  但最早,這項工作并不是由實習生來做,而是那些年薪百萬的人工智能工程師。

  31歲的杜霖是倍賽(北京深度搜索科技有限公司)的首席執行官,公司在北京、山西、山東、河南、四川、貴州、福建等地建設數據標注工廠,有近3000人的數據標注員團隊。“對AI 和數據的研究,我們很早就開始了。”畢業自上海交通大學的杜霖告知,他的創始團隊均來自上海交大。

  最早在2014年,杜霖注意到,隨著人工智能在商業場景的應用逐漸落地,原來由工程師在實驗室完成的數據標注呈“指數級增長”,工程師們應接不暇,專業的數據加工服務公司應運而生。

  國務院發布的《新一代人工智能發展規劃》顯示,到2020年,我國人工智能核心產業規模超過1500億元,帶動相關產業規模超過1萬億元。杜霖判斷,未來人工智能領域一定會出現巨大缺口——對于由人標注的數據的需求。“因為現在的人工智能還只是兩三歲的孩子,需要我們不斷地教它認識杯子、水果、玩具和汽車。”

  作為人工智能產業的下游端,“吳潘威們”對行業勃興的感知或許是最敏感的。

  “從去年起,一個個項目接踵而至。”曾蕓說,“目前夢動所承接的項目幾乎囊括所有人工智能領域:圖片、文本信息、語音、視頻、在線審核等,其中圖片是最大的一塊。”

  吳潘威已經記不清標注過多少項目,“五花八門,難以想象”。無人售貨超市里,商品種類數以萬計,光背包就有十幾種;甚至有美甲店要求訓練能識別指甲區域的機器人,那樣就不會把指甲油涂到指甲外……

  6月29日,在夢動科技,記者看到辦公室的柜子上擺放著幾十種可口可樂飲料。項目組長蔣純潔介紹,標注員需要先記住所有產品的類別、口味、容積,同一款產品要仔細看包裝顏色和圖案細微的不同之處,“否則標注的時候再去看就太慢了”。

  “最奇怪的是給貓臉和狗臉打點。”項目主管賈如松說。兩個多月前,他們花了整整兩個星期給一萬多張貓和狗的圖片打點,每張臉上要打34個點,“想來想去也沒想明白這到底是用來干啥的”。

  “大學生為什么要來做這個”

  吳潘威是最早一批來夢動科技的實習生之一。做數據標注員兩年多,當初和他一起實習的同學大多都離開了;而在他實習期間,數不清的實習生來來往往。他們抱怨工作枯燥乏味,沒什么前途。

  “大學生為什么要來做這個事情?”吳潘威也不止一次問過自己。

  出生于1999年的陸森霖是貴州盛華職業學院計算機專業的大一學生,實習近3個月了。學校離公司只有1公里左右,這是學校在產教融合方面的部署。

  陸森霖正在做的項目是語音識別,每天的基本任務是將約1800秒的語音輸出成文字,將重疊在一起的幾個音色分開,這會花費他五六個小時;最麻煩的是專業術語,不懂的名詞要上網查;做完之后由質檢員核對,如果有錯誤就會被打回來重新修改。

  “我完全不知道意義在哪里。”陸森霖說,“你看我開著音樂,聽幾百秒就切過來放首歌放松,否則一直聽會受不了。”

  標注工作單調重復。“再難的項目3天之內就能隨便耍了。”標注員梁紅說,他是記者碰到的少有的對人工智能感興趣才來實習的學生。

  數據標注行業有一套明確流程:上游的人工智能公司將項目交給中游的數據加工公司或眾包平臺,后者自行加工或分包給下游的小公司、小作坊,有的小作坊還會分發給“散兵游勇”,比如學生或二三線城市的兼職人員。

  而到了下游,項目經過層層轉包,利潤已經低得嚇人。“這與我們一線標注員的付出是不對等的。”曾蕓說,早期夢動科技只能從中游的眾包平臺獲取項目,現在則盡量直接對接上游客戶。

  如今,上游的人工智能公司仍保留少量數據標注員。“我們的全職標注團隊主要是處理隱私性高和有特殊要求的數據,比如處理醫療領域的數據就需要有一定專業背景。”云從科技研究院副院長周翔介紹,“其余的數據處理便交給下游幾十家數據標注團隊。”在被稱作“國內首檔人工智能挑戰類節目”的央視熱門節目《機智過人》中,曾與模擬畫像專家林宇輝在同一舞臺競技的,就是云從科技所打造的人工智能“御眼重明”。

  對一般的數據標注員而言,職業生涯是一眼望得見頭的:從一線標注員做起,然后是質培專員(相當于質檢)、項目組長、項目主管、項目經理,最后是部門總監。

  “簡而言之,就像上世紀80年代的來料加工,大工廠可以,家庭作坊也可以。”夢動科技聯合創始人農政說,“甚至有人把數據標注員比作流水線上的工人,幾個學生、幾個零散人員都可以接單。”

  農政并不否認目前數據標注確實是一個需要大量勞動力的行業,但他強調,應該看到行業發展的未來,“不能現在看到他們在畫框,就判斷未來十年他們還在畫框。”

  今年7月,吳潘威終于作為正式員工與公司簽約,成為一名商務助理。實際上,他從未想過自己能留下來。當初一起實習的有近百人,和他一樣最終成為正式職工的僅有11人。他們不再做標注員,而是走上項目組長等管理崗位。

  “也許這是我們接觸最前沿科技唯一的機會。”吳潘威說,他的大多數同學畢業后都去從事銷售、中介等工作,而在夢動,他能與最先進的科技公司對接,感受信息技術帶來的震撼。

  “不如我們發明標注機器人來解放自己”

  每天早上9時,吳潘威準時到公司。一旦進入工作角色,每個人都是緊張而嚴肅的,相互之間很少交流,若遇到緊急項目,他們還需要加班加點完成。

  短短兩年間,從小小的鼠標一端,吳潘威便感受到了另一端世界前沿科技進步的速度,“以前無人駕駛汽車框出基本輪廓就可以了,現在不只是從2D平面進化到3D立體,還要標注車頭的方向。”

  在夢動科技,“大數據,讓一切變得更智慧”等標語隨處可見。醫療、金融等人工智能近年來踏進的領域,都在日新月異地改變,而起點就在小鎮年輕人的手指尖。百鳥河數字小鎮聚集了大數據、教育文化、健康養老、文化旅游等眾多公司,是當地著力發展大數據產業所建的新型園區。一幢幢彩色尖頂的歐式小樓,令小鎮充滿異域風情。

  實際上,數據標注本身也是一個要用人工智能來改造的行業,標注工具也正在迭代升級。比如,人臉識別最早均由人工標注關鍵點,但眼下吳潘威接到的項目里,機器已經打好點,標注員要做的只是最后的校正。

  在杜霖看來,其實不必把數據標注看得過于神秘,“說到底人工智能數據標注只是商業外包行業一個非常細的分類,幾十年前這種數據外包業務就已存在,比如替銀行處理電子表格的公司,但因為人工智能,數據標注才變成了一個獨立的行業”。

  在數據標注領域,更大的潛在威脅可能并非同行競爭,而是來自機器——當算法足夠先進時,少量的數據就能達到效果,到那時,還需要這么多的數據標注員嗎?

  “也許有一天人工智能會全面取代人類,但數據標注員一定是最后被取代的那批人。”杜霖對此保持樂觀態度,“最高明的算法也需要基礎的數據學習,而數據標注員,一定是堅持到最后一班崗才把數據交付給機器模型的。”

  夢動科技人工智能服務部助理總監龔芳芳也說:“想象把人工智能當作嬰兒,而我們可以把他訓練成天才。”

  人們似乎樂意見到“機器天才”與人類的競爭。根據百度搜索指數,公眾對人工智能的關注從2016年起呈顯著上升趨勢,當年3月的圍棋人機大戰——AlphaGo擊敗圍棋世界冠軍李世石,第一次將人工智能帶入大眾視野。

  人工智能是否會替代人類?

  對吳潘威來說,這并不是個沉重的話題。“標注員之間還常常開玩笑,不如我們自己發明一個標注機器人來解放我們自己。”他笑著說,“畢竟,人都是懶惰的。”

  而在通往未來無限可能性的路上,數據標注員們最大的挑戰依舊是克服乏味與寂寞。

  一名年輕的標注員說,以前他與一位小伙伴會在一起比,誰今天畫的框多,“他框了300個我框了400個,第二天他就不跟我說話,一直框。但是現在,他走了,我才覺得這個工作真是無趣”。(見習記者 向凱)

+1
【糾錯】 責任編輯: 楊婷
新聞評論
加載更多
華盛頓民俗節上演疊羅漢
華盛頓民俗節上演疊羅漢
哺育
哺育
新華社國內照片一周精選
新華社國內照片一周精選
俯瞰夏日西湖
俯瞰夏日西湖

?
010020020110000000000000011199701123094026
国产精品99一区二区三_免费中文日韩_国产在线精品一区二区_日本成人手机在线
亚洲欧美中文日韩在线| 国产精品成人免费精品自在线观看| 一区二区三区www| 一区二区电影免费观看| 亚洲一区二区日本| 午夜精品视频在线观看| 久久久久九九视频| 欧美好骚综合网| 国产精品成人免费视频| 国产日韩欧美视频| 亚洲高清在线观看一区| 日韩一区二区精品| 亚洲一区二区三区三| 久久国产精品72免费观看| 蜜桃av一区二区三区| 欧美成人综合网站| 国产精品嫩草99av在线| 伊人男人综合视频网| 日韩西西人体444www| 欧美一区二区三区在线视频 | 欧美综合国产精品久久丁香| 久久这里有精品视频| 国产精品h在线观看| 狠狠88综合久久久久综合网| 亚洲国产欧美一区| 亚洲综合色网站| 久久综合亚州| 欧美日韩一区二区三区在线观看免 | 亚洲三级视频| 欧美一区二区三区免费在线看| 裸体女人亚洲精品一区| 国产精品久久久久999| 亚洲缚视频在线观看| 亚洲一区一卡| 牛牛影视久久网| 国产精品久久久久久久午夜 | 久久久久久综合| 欧美日韩一区二区在线观看视频| 国产无一区二区| 亚洲麻豆av| 久久久久久夜| 欧美性一区二区| 亚洲成人影音| 先锋影音一区二区三区| 亚洲综合精品四区| 免费不卡中文字幕视频| 国产精品揄拍500视频| 国内精品写真在线观看| 亚洲激情六月丁香| 欧美一区免费视频| 欧美日韩一区二区三区免费看| 国产日韩亚洲欧美精品| 一区二区三区视频在线看| 美女精品网站| 国产亚洲午夜高清国产拍精品| 亚洲私人影院| 欧美精品一区二区三区蜜臀| 黄色成人在线| 小嫩嫩精品导航| 欧美日韩综合久久| 亚洲大胆美女视频| 午夜视频一区二区| 欧美精品一区二区精品网| 极品中文字幕一区| 小黄鸭视频精品导航| 欧美午夜精品久久久久久浪潮 | 激情欧美一区| 欧美一级理论性理论a| 欧美午夜精品久久久久久久| 亚洲欧洲日产国产综合网| 久久激情五月激情| 国产欧美日韩视频在线观看| 亚洲天堂av电影| 欧美日韩国产黄| 最新热久久免费视频| 六月婷婷一区| 精品动漫3d一区二区三区| 欧美一区二区三区的| 国产精品免费一区二区三区在线观看| 夜夜狂射影院欧美极品| 欧美精品高清视频| 亚洲人人精品| 欧美二区在线| 亚洲国产片色| 免费在线亚洲| 亚洲成在线观看| 男女激情视频一区| 亚洲高清激情| 欧美不卡视频| 亚洲欧洲在线免费| 欧美精品免费视频| 亚洲精品午夜| 欧美精品在线一区二区| 亚洲精品一区二区三区婷婷月| 欧美二区在线看| 亚洲精品在线视频观看| 欧美—级a级欧美特级ar全黄| 最新国产乱人伦偷精品免费网站| 免费欧美日韩| 最新国产成人在线观看| 欧美精品在线观看播放| 久久久国产91| 一区二区在线观看av| 久久久中精品2020中文| 在线观看91久久久久久| 免费久久精品视频| 亚洲免费成人| 国产精品v欧美精品v日本精品动漫| 亚洲一二三区视频在线观看| 国产精品任我爽爆在线播放 | 亚洲国产高清在线| 欧美成人综合网站| 亚洲最新合集| 国产精品美女午夜av| 欧美一区二区在线视频| 激情久久久久久久| 你懂的国产精品| 日韩视频免费看| 国产精品国产精品| 欧美一区久久| 亚洲国产日韩欧美在线动漫| 欧美精品在线播放| 亚洲永久精品国产| 国产在线麻豆精品观看| 美国三级日本三级久久99| 亚洲精品中文字幕在线| 国产精品福利在线观看| 久久国产精品久久久久久电车| 在线观看一区二区精品视频| 欧美日韩八区| 午夜视频一区在线观看| 亚洲第一色中文字幕| 欧美日韩精品一区二区三区| 午夜欧美大片免费观看| 黄色成人片子| 欧美日韩国产区一| 性欧美video另类hd性玩具| 伊人久久婷婷色综合98网| 欧美日本一区二区视频在线观看| 午夜精品国产更新| 亚洲电影下载| 国产精品久久久久久久久久尿| 久久精品视频在线| 亚洲美女在线国产| 国产精品一卡| 欧美大色视频| 欧美在线亚洲综合一区| 亚洲美女在线看| 国内精品伊人久久久久av一坑| 欧美极品在线视频| 欧美影片第一页| 亚洲美女在线一区| 国产自产女人91一区在线观看| 欧美裸体一区二区三区| 欧美资源在线观看| 亚洲国产视频直播| 国产欧美丝祙| 欧美日韩高清一区| 久久久久久穴| 在线日韩中文| 国产乱码精品一区二区三区av | 国产精品国码视频| 毛片精品免费在线观看| 亚洲欧美日韩另类| 亚洲精品系列| 红桃视频成人| 国产精品免费在线| 欧美激情精品久久久久久大尺度 | 欧美1级日本1级| 欧美亚洲免费在线| 99精品免费网| 在线观看欧美日本| 国产欧美日韩在线| 欧美日本中文| 蜜桃久久精品乱码一区二区| 欧美亚洲一级片| 一区二区三区高清视频在线观看 | 一级成人国产| 在线精品一区| 国产欧美丝祙| 国产精品a久久久久久| 欧美福利视频网站| 久久青青草原一区二区| 欧美一级大片在线观看| 亚洲视频在线观看三级| 亚洲精品女av网站| 亚洲高清自拍| 国外成人在线视频网站| 国产欧美精品一区二区色综合| 欧美特黄一级大片| 欧美日本在线视频| 免费不卡亚洲欧美| 久久亚洲电影| 久久久久国产精品一区二区| 欧美一区二区三区四区高清| 亚洲愉拍自拍另类高清精品| 99热这里只有精品8| 亚洲三级电影全部在线观看高清| 在线电影国产精品| 一区免费观看视频| 激情婷婷久久| 在线观看日韩国产| 亚洲福利在线视频| 亚洲国产日韩欧美综合久久|