你的靈魂畫作都去哪兒了?揭秘“猜畫小歌”背后的5000萬組數(shù)據(jù)
作者:文摘菌,來源:大數(shù)據(jù)文摘
自從退出中國的搜索引擎市場,谷歌大概無時不刻都想”卷土重來“。昨天,這家以搜索引擎著稱的巨頭公司用一款微信小程序“猜畫小歌”占領(lǐng)了朋友圈“C位”,刷足存在感的同時,還順便激發(fā)了身邊一票“靈魂畫手”。
比如這樣的蒙娜麗莎:
或者這樣的美人魚:
“猜畫小歌”來自Google AI的一款小程序,這也是谷歌第一款微信小程序。據(jù)谷歌官方博文介紹,用戶可以和谷歌的AI組隊,在有限的時間內(nèi)進行速寫。在每一輪體驗中,用戶需要在規(guī)定時間內(nèi)勾勒出一幅日常用品的圖畫(比如狗、鐘表或鞋子),AI“小歌”則需要在時間結(jié)束前猜出圖畫中的物體。
查看案例詳情:http://www.sh-jinniu.com/projects/31408.html
當 AI 猜出你圖畫中的物體時,你就會進入下一輪,你的猜畫連勝次數(shù)也會相應(yīng)增加。你還可以分享有趣的素描圖,并在體驗過程中不斷收集新的題目和圖畫。
據(jù)谷歌介紹,“猜畫小歌”背后的技術(shù)主要是計算機視覺和神經(jīng)網(wǎng)絡(luò),由來自Google AI的神經(jīng)網(wǎng)絡(luò)驅(qū)動。
當然,在畫的停不下來的同時,不少人也充滿遺憾,谷歌的這個微信小程序,只是為了在中國刷刷久違的存在感嗎?
當然沒有這么簡單。
其實,這只小程序并非中國首發(fā),早在去年11月,谷歌就上線了一款叫“Quick,Draw!”的線上游戲,也就是“猜畫小歌”的網(wǎng)頁原版。這款游戲中,玩家也需要在一定時間(20秒內(nèi))畫出要求的圖案,比如駱駝或洗衣機之類的。
游戲界面?zhèn)魉烷T:https://quickdraw.withgoogle.com/
這款網(wǎng)頁版游戲目前仍然可用,如果在中國大陸的你懂得科學上網(wǎng),可以點擊上邊的鏈接進入,感受一下用鼠標畫圖的難度,絕對比手指畫要艱難許多了。
當然,谷歌后來表示,發(fā)布這個游戲的目的遠不止讓用戶開心,真正的初衷是運用這些草圖,讓計算機學習人如何繪畫。(意味深長啊)
大方的谷歌并沒有私吞這些網(wǎng)友智慧的結(jié)晶,截止今年五月,這款游戲的網(wǎng)頁版已經(jīng)從全球各地收集了五千萬份不同的繪畫,并且在谷歌上開源了數(shù)據(jù)庫。
這些簡筆畫不僅整理清晰,還被貼心的做好了標注。感興趣的同學可以去github或者谷歌自取數(shù)據(jù)集哦。
數(shù)據(jù)集github鏈接:https://github.com/googlecreativelab/quickdraw-dataset
數(shù)據(jù)集谷歌鏈接:quickdraw.withgoogle.com/data
這一數(shù)據(jù)集包含了來自全球100多個國家和地區(qū)人們的繪畫數(shù)據(jù),據(jù)谷歌消息,這些數(shù)據(jù)也被用來優(yōu)化了本次微信小游戲“猜畫小歌”的開發(fā)。
但是,基于谷歌網(wǎng)站在中國的境況,中國大陸的畫作數(shù)據(jù)遺憾缺失。
不過,本次谷歌微信小程序上線后,中國畫手的信息終于可以補充進來啦,感興趣的同學也可以坐等數(shù)據(jù)集的更新了。
想到自己的畫作還能被收錄進入數(shù)據(jù)庫,為人工智能和人類的進步作出一份微薄貢獻,是不是有點小激動呢?
那么,這些數(shù)據(jù)能用來做什么呢?
文摘菌深夜咨詢了一些科技咖們,得到了很多有趣的猜測:
比如,剛剛從日本回來的Andy同學就認為,可以用來收集abstract reasoning的數(shù)據(jù),讓機器了解什么是貓;
又比如,來自斯坦福的Q同學覺得,這是可以被作為輪廓識別的寶貴數(shù)據(jù)。
除了這些在人工智能中的寶貴效用,以數(shù)據(jù)新聞著稱的海外科技媒體Quartz和兩位記者,從更人文的角度,給出了一些不太一樣的研究思路:他們希望通過比較世界各地人們繪制基本圖形的方式,了解文化對繪畫的影響。
這要得益于谷歌完備的數(shù)據(jù)庫,這一數(shù)據(jù)庫不僅包含了來自148個國家和地區(qū)的人所畫的11.9萬個不同的圓,也記錄了每個玩家的手指(或鼠標)經(jīng)過路線的坐標。
通過對其中從66個不同國家收集的100多個圓進行一些簡單的幾何分析,他們發(fā)現(xiàn),不同國家的人習慣于不同的畫圓方向:
美國人喜歡逆時針畫圓,在近5萬個美國人所畫的圓中有86%是逆時針畫的。恰恰相反,日本人更多習慣于順時針畫圓,800個日本人畫的圓中有80%是順時針畫的。
下圖是100個來自不同國家和地區(qū)的人所畫的圓的隨機抽樣:
英國,捷克,澳大利亞和芬蘭人跟美國人有大致相同的比例逆時針畫圓。
法國,德國和菲律賓人甚至有更高的比例-大致90%去逆時針畫圓。在越南,95%的人逆時針畫圓。
Quartz分析的數(shù)據(jù)庫顯示,大部分國家和地區(qū)的人更傾向于逆時針畫圓,唯獨兩個例外:臺灣和日本。
這一項目的成果在一年前發(fā)布在Quartz上:https://qz.com/994486/the-way-you-draw-circles-says-a-lot-about-you/
*大數(shù)據(jù)文摘在去年十二月已經(jīng)發(fā)布了Quartz這篇文章的編譯版,重刊如下,感興趣的同學可以繼續(xù)閱讀。
如何解釋這種差異呢?Quartz也做出了自己的猜測。
一個顯而易見的原因是不同國家的語言。人們書寫文字的不同方式,從上到下,從左到右或是從右到左,是否能夠解答他們繪畫方式的不同呢?美國,西歐和拉丁美洲人的口語雖有差別,但書寫方式大致相同。然而亞洲和中東卻有著與上述國家截然不同的書面文字。
下面幾幅圖展示了一些代表性文字的書寫方式:
比如,先來看看日語中的文字。這里展示了日語中三種文字符號:平假名(hiragana),片假名(katakana)和萬葉假名(kanji)。萬葉假名基于漢字的表意文字,而平假名和片假名是表音文字。其中,平假名最接近于英文字母,也有最多的圓形筆劃,其中大部分圓形筆劃都是順時針方向:
文字あ像英文字母a,是這樣書寫的:
日語和中文的文字都遵循嚴格的筆劃順序。整體來看,一個字是從左上到右下的方向書寫的。美國羅格斯( Rutgers)大學數(shù)學教授書法家黃一知這樣解釋道:如果你畫一條水平線再畫一條垂直線,就像數(shù)字7一樣,那么日文和漢字的書寫規(guī)則就是把這兩條線當做一個筆劃,中間也沒有停頓。(可以自己從紙上嘗試一下)
因此我們的手會自然而然形成習慣去順時針動,就像漢字“了”代表著一個動作的完成。
基于中文的文字的書寫規(guī)則在小孩子剛剛拿起鉛筆的時候就深深印在他們腦子里了,這也奠定了臺灣和日本的人畫圓基于相同的書寫方式。
當然,限于當時谷歌在大陸的狀況,這款網(wǎng)頁游戲沒有辦法搜集到大陸的信息,這一研究也沒有中國大陸的數(shù)據(jù),但Quartz研究了過往的研究,發(fā)現(xiàn)調(diào)查結(jié)果也支持了這個發(fā)現(xiàn)。
在1985年對中國人畫圓方式的調(diào)查中發(fā)現(xiàn),151位參與者中有72%的人順時針畫圓。研究者指出,這也許是因為在行書(中國書法的一種)中筆劃多為順時針。
有興趣的同學也可以坐等谷歌更新帶有大陸數(shù)據(jù)的數(shù)據(jù)集,然后繼續(xù)這個研究啦。
三角形繪畫方式的相似度在基于中文的語言中更加顯著。97%臺灣地區(qū)的畫手和90%的日本人和韓國人都是逆時針畫三角形。對比來看,美國人一筆劃出的三角形,只有一半多一點的比例是逆時針的。
基于漢字的筆劃順序規(guī)定對角線的格式,就像一個三角形,是先從右向左再從左向右的。從“人”這個字,就不難發(fā)現(xiàn)這種規(guī)律。
另外一組國家的例子也可以讓人們更好地理解畫圓方式的不同。阿聯(lián)酋,科威特,阿爾及利亞,約旦,沙特阿拉伯,以色列,伊拉克和埃及在下面畫圓方式的分布圖中聚集在一起,幾乎互相挨著(除了泰國和韓國在中間)。
阿拉伯文和希伯來文包含很多曲線,讀和寫都是從右向左的順序。在阿拉伯語中,文字的曲線跟隨著手的方向,通常是順時針,這也更好地控制字與字的間隔。
下面是字母“b”和“n”在阿拉伯語中的書寫方式:
如果對剩余國家畫圓方式觀察更仔細一些,就可以發(fā)現(xiàn)其他的一些規(guī)律。舉個例子,韓語(朝鮮語)的書寫系統(tǒng)中有大量的圓形。1500個韓國人所畫的圓有72%是逆時針畫的。
你也許以為韓國會跟臺灣和日本的結(jié)果相似,但韓語的書寫規(guī)則其實是與中文和日語恰恰相反的:圓形都是逆時針書寫的。這就直接導致韓國畫圓方式的結(jié)果更趨近于其他的那些國家。
在泰國的結(jié)果中,有64%的圓是逆時針的,而其文字書寫同樣也包含著大量的圓形筆劃。在42個輔音中,幾乎所有都是從一個小圓圈開始寫。開頭的這個圓圈可以順時針也可以逆時針,但逆時針的圓是順時針的兩倍多。
下面是發(fā)音“m”的泰文:
你也許會問另兩種充滿圓形的文字,緬甸語和格魯吉亞語的結(jié)果如何。
緬甸同日本和臺灣結(jié)果相近,僅22%的圓形是逆時針的。這支持了我們所得出的結(jié)論,但由于樣本只有9個,我們不能這樣輕易下結(jié)論。相似的,格魯吉亞只有72個數(shù)據(jù),所以不具代表性。
剩余的50個國家傾向逆時針畫圓。這些國家?guī)缀跛卸荚谑褂眠\筆從左至右、且沒有過多圓形筆畫的拉丁字母。英語也有筆順,不過沒有那么死板:可能是因為在孩提時期像大多數(shù)使用拉丁字母的國家畫圓那樣一遍一遍地逆時針寫“c”和“g”。
當然,盡管有許多證據(jù)表明文字能夠影響人們畫圖形的方式,但是這一理論也不能解釋一切。越南也像美國一樣使用拉丁字母,并且有95%的人逆時針畫圓,可是使用中文筆畫的香港也有82%的人逆時針畫圓。
另一種可能的解釋是有人是左利手。也許右利手自然地傾向于逆時針畫圓,除非書寫系統(tǒng)教他們反向(順時針畫圓)。來自Quick,Draw!的數(shù)據(jù)并沒有表明用戶是左利手還是右利手,慣用手的不同可能顯著地影響到他們畫圖的方式。盡管如此,不同國家的左利手并沒有太大的不同,這可能并不能解釋臺灣地區(qū)、日本和其它國家之間的巨大區(qū)別。
那么,究竟什么才是正確的做法呢?
Quaritz在文章中也做出了分析,在20世紀70年代美國為兒童開發(fā)的一項名為“torque test”(“扭力測試”)的常見的心理學練習中,孩子們會得到一張紙,上面有這個。
為了幫助研究人員辨明孩子是左利手還是右利手,孩子們被告知要先后用兩只手畫圓把X圈起來。如果孩子逆時針畫所有的圓(被認為是右利手的證據(jù))則被認為是“非標準”。如果孩子順時針畫了一個圓(與左利手相關(guān))都被認為是“標準”。
美國心理協(xié)會主席、扭矩測試的創(chuàng)造者Theodore Blau在1977年發(fā)表的論文中認為,順時針畫圓是學習與行為變異的標志。他警告說,標準畫圓的孩子們,可能有得精神分裂癥的危險。
心理學家們后來反駁了上述觀點,并且一些人特別關(guān)注文化和教育對兒童繪畫習慣的影響。在1997年的一項跨文化研究中調(diào)查了不同年齡段的,在美國生活的美國學生、在日本生活的日本學生和在美國生活的日本學生:62名日本一年級學生中,約有半數(shù)同學順時針畫圓;三分之一的學生逆時針畫圓;五分之一的學生兩種方式都用。
但是,幾乎全部的六年級學生都是順時針畫圓,這暗示著研究者們孩子寫字越多,他們順時針畫圓的變得更加明顯。相比之下,有64%的美國學生逆時針畫圓,這個比例在六年級學生中也只有些許變化。
但是,并不只有日本是這樣。在1973年的跨文化研究中調(diào)查了不同年齡段的美國和以色列兒童是如何畫圓的,結(jié)果表明,也有大量的兒童逆時針畫圓。
研究人員指出,對以色列來說結(jié)果正好相反,他們用到的最接近圓的字母“?”,是順時針寫的。隨著時間的推移,美國人在畫圓的方向上更趨一致,100%的成年受試者逆時針畫圓。在以色列,各個年齡段的受試者中有70%順時針畫圓。
這些研究表明,不僅文化和寫字方式(書法)塑造了人們繪制抽象形狀的方式,而且也表明這種趨勢隨著時間的推移越來越明顯。寫的越多,習慣越根深蒂固。出于同樣的研究目的,我們在全世界范圍內(nèi)收集了90,000個圓,構(gòu)造了一個規(guī)模更加龐大、數(shù)據(jù)更加一致的數(shù)據(jù)集用以支撐過去在小規(guī)模數(shù)據(jù)研究中得到的結(jié)果。
如果英語是你的第一語言,你可能已經(jīng)忘記了小時候上學時,艱難地握著鉛筆,笨拙地按照要求的結(jié)構(gòu)臨摹大小寫字母。在某些語言中,這些規(guī)則不是可以忘卻的記憶,而是書寫的首要條件。比如,在日本和中國,筆順是工整書寫的重要部分,甚至可以象征著教育程度。
現(xiàn)代漢語筆順系統(tǒng)是從漢代盛行的隸書系統(tǒng)演變而來的。隸書書寫時間太長,而人們想要寫的更快,因此隸書演變成行書,一種半草書風格,最終演變成今天的筆畫。根據(jù)書法家黃的說法,使用軟毛筆書寫能夠了解更多的現(xiàn)代中文筆順規(guī)則。
日本人同中國人一樣講究筆順。在1958年,日本教育部制定了國家級的筆順準則,建立了統(tǒng)一的標準,避免出現(xiàn)混亂。(如今這些規(guī)則被放寬了。)
“我認為我運筆的方式很有效并且寫出的字很漂亮”,日本協(xié)會語言中心主任TomoyoKamimura說道。“一些成年人書寫筆畫順序完全錯誤,我們輕視他們那樣書寫,我們認為他們沒有接受教育。”
如今,美國的小孩逐步被傳授印刷體和手寫體的方法,這種方法叫做“快樂書寫”。該方法提倡使用“魔法C”,一種逆時針曲線,用在“c,g,q,o”等字母中。因此,美國的學校會鼓勵小孩子們逆時針畫圓,來幫助他們養(yǎng)成以后第一次書寫字母時所需的基本運動技巧。
什么塑造了我們?
我們有無數(shù)種微妙的方式,不知不覺地將文化帶進我們的世界:繪畫的方式,手勢的意義以及模擬真實世界的聲音。而這是海量數(shù)據(jù)的核心樂趣所在。
為了測試我們的理論,我們請了一些母語使用日語、阿拉伯語、希伯來語、漢語、泰語和越南語的同事、朋友和家人來畫圓圈,雖然這樣感覺有點不太好。但他們?nèi)匀缓芨吲d的加入了,因為他們除了好奇到底自己是怎么畫圓以外,他們也渴望了解一個嶄新的領(lǐng)域。
誠然,這世界上還有很多我們不懂的事情。于此同時,對繪制形狀的研究在心理學上好像已經(jīng)過時了。除了一個例外,我們發(fā)現(xiàn)所有與文化相關(guān)的圖形繪制研究以及“扭矩測試”(“torque test”)都是在1997年之前的。
我們可以合理推斷一下,全世界的人越來越多通過打字來交流,然而盡管某一天書法的藝術(shù)會被遺忘,但到了那個時候,也許我們已經(jīng)形成了一個全新的以鍵盤為主導的文化差異呢。
經(jīng)授權(quán)轉(zhuǎn)載至數(shù)英,轉(zhuǎn)載請聯(lián)系原作者
作者公眾號:大數(shù)據(jù)文摘(ID:BigDataDigest)
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
全部評論(3條)