導讀:零售場景的分散化和多變性給新技術帶來了莫大考驗,也讓市場更加不確定。人工智能視覺能否被一片傳統(tǒng)土地接納,這是場復雜得多的踐行。
“我們相信零售會成為我們第15個營收過千萬的行業(yè)?!鄙虦瘓F總經理尚海龍說。
近三年,商湯代表的計算機視覺公司以算法和更高的精準度打破海康、大華等傳統(tǒng)巨頭的藩籬,闖入相對封閉的安防領域。
隨著安防市場的紅海化,恰逢線下零售的升級換代,2017年下半年,視覺技術里大小玩家紛紛押注零售,安防領域的AI明星在思量這會不會成為下一個高地,在小眾領域耕耘已久的潛力股,也在期盼得到走向臺前的機會。
“通過技術賦能效果展現(xiàn)了以后,我相信整個零售行業(yè)真正進入了從商品或服務來要利潤,轉成向數(shù)據(jù)要利潤,大家能夠意識到數(shù)據(jù)的價值,這個意識的轉變是偉大的?!?/p>
但是零售場景的分散化和多變性給新技術帶來了莫大考驗,也讓市場更加不確定。人工智能視覺能否被一片傳統(tǒng)土地接納,這是場復雜得多的踐行。
看清人臉是基本功
顧客在閘門前面對攝像頭站定,數(shù)秒后連接攝像頭的屏幕上出現(xiàn)機器采集的人臉,即完成身份認定,購物結束再次刷臉可支付離店。在蘇寧體育Biu門店里,這張臉也正是用戶的逛街ID,攝像頭以及背后的機器兢兢業(yè)業(yè)地記錄著:男,25歲,在耐克鞋前停留時間較長,購買了一頂鴨舌帽。
蘇寧Biu的視覺解決方案由商湯提供,對于CV(即:計算機視覺 computer vision)明星公司而言,識別人臉乃看家本領。2014年,商湯創(chuàng)始人湯曉鷗的聯(lián)合實驗室用20萬人臉數(shù)據(jù)達到98.52%準確率的成績,超越人眼,在業(yè)界一炮而紅,之后,商湯以技術優(yōu)勢殺入資金充沛、需求剛性的安防市場。
“圖像四小龍”商湯、依圖、曠視、云從發(fā)展路徑類似,去年都完成數(shù)億元融資。三四年前,全國安防設備產生的海量數(shù)據(jù)亟待處理分析,比如如何在火車站的人海中扒出流竄的犯罪嫌疑人,把持政府項目的傳統(tǒng)巨頭卻無力消化,人工智能視覺“趁機而入”。
2017年,尤其是下半年,隨著新零售、智慧零售的概念落地,視覺明星們也陸續(xù)殺入其中,包括商湯、曠視、依圖、圖普、閱面等等。它們以“刷臉進場“和“刷臉支付”占到一席之位,商湯與蘇寧聯(lián)手,曠視拿下了阿里巴巴的淘咖啡,圖普把技術鋪到了天福超市、EasyGo以及OPPO……
兩項功能被廣泛應用于無人門店和升級改造中的傳統(tǒng)零售店,這也是目前視覺技術最被熟知的功能,最直接的效果是可以簡化收銀環(huán)節(jié),節(jié)約成本。
當然,初出茅廬,在陌生的零售場域打拼容易么?
“AI不具備普適性,沒有萬能的,不同場景對算法的要求不一樣。相比安防和金融,零售的場景太復雜多變了?!币晃灰曈X產品經理感嘆道。
據(jù)透露,目前的刷臉技術其實相對簡單?!笆袌錾咸峁┑乃惴ǘ嗍钦娴讕熳R別,這種門禁模型做線下零售是有一定的問題。線下零售要做到無感知,可能不是通過注冊的人臉做識別,而是第一次進店的抓拍作為底庫,可能光線不好,可能有遮擋,可能是側臉,這就需要專門的訓練?!?/p>
尤其是涉及支付環(huán)節(jié),必須人為設置固定的靜態(tài)場景,強制要求消費者配合,即便是人臉識別老大商湯所搭建的蘇寧Biu店也依托于閘門。
“現(xiàn)在謹慎一點的,像各大銀行ATM刷臉取款增加六位密碼確認;大膽一點的,像蘇寧門口有閘機,結賬一個個排隊,這樣支付環(huán)境有固定的靜態(tài)場景,準確率基本可以做到百分之百。大量的動態(tài)比對會成問題?!鄙泻}堈f。
理論上,機器視覺不是沒辦法抓取非配合條件下的動態(tài)人臉,火車站里抓捕逃犯就涉及到人臉檢測、特征提取、比對多項技術,機器先在一幀視頻中框出所有的人臉,然后挨個與公安機關的照片數(shù)據(jù)庫對照。但問題在于,場景的變化要求對算法同步調整優(yōu)化。
簡24原本調用過外部的技術,但后來選擇了自主研發(fā)。“并不是因為外部技術不好,在機場這種公共場所,能從茫茫人海當中一眼把恐怖分子識別出來,產品挺牛的,但關鍵問題在于,第一,需要為我們的場景做優(yōu)化,任何的算法都要根據(jù)本地場景優(yōu)化才能達到最好的效果。第二,它們的訓練人群和我們的不一樣。”創(chuàng)始人林捷透露。
同時,人臉本身的局限性能否完全應用于零售業(yè)也存在爭議?!拔覀冋J為外部特征不能作為人的終生ID,或者綁定金融支付,很危險的?!鄙钐m科技創(chuàng)始人陳海波說。他對自家的“不要臉運動”深以為豪,以掃手取代刷臉,掃的是靜脈、動脈和毛細血管,以每一根血管的分叉點和點與點之間位置關系為特征值?!拔覀兊腘值達到4億(能與4億數(shù)據(jù)做對比,簡單說,N值越高算法和算力越強),再加上4位手機號碼,做到了40億?!?/p>
公開數(shù)據(jù)顯示,商湯2017年有20億張人臉數(shù)據(jù),2億個體訓練,達到9位密碼時代。
進場之后,靠臉的可能性也不大了。
“一說到視覺技術就想到刷臉,其實這是最為簡單基礎的功能?!绷纸菡f,“進場之后拍不到人臉,靠體態(tài)識別這個人,知道他拿了什么商品,這比較難?!?/p>
業(yè)內公認的、視覺技術應用的極致表現(xiàn)為Amazon Go,全程通過機器捕捉看了什么,拿走了什么,離店后自動扣款,當然,為確保準確性,Amazon Go還采用了重力感應器、二維碼、紅外感應器等輔助技術。
深蘭于2016年4月發(fā)布了無人值守零售解決方案,陳海波告訴億邦動力網(wǎng),人與貨關聯(lián)的算法極為復雜,“入場時采集到人的數(shù)據(jù),包括人的體型,頭到地面的距離,肩到地面的距離,這是一個綜合數(shù)據(jù),攝像頭一直在追蹤用戶。在商品區(qū)有一條無形的電子柵欄,手伸進去以后觸發(fā)攝像頭開始抓取動作。攝像頭以每秒30幀抓取手,當觸及商品時每秒120幀, 同時實時去背,扣掉背景,讓攝像頭都集中看商品,更精準判斷它是什么?!?/p>
“全程要調動多個攝像頭協(xié)同監(jiān)控,實時調整每個攝像頭的權重。如果商品和背景一個顏色,那機器大腦也沒辦法了。”
你們這方案多少錢?
“零售毛利低,對每一筆投資都會非常謹慎。相應而言,它是一定要看到效果才會投資。”尚海龍說。
從安防到零售,作為服務方的計算機視覺公司明顯感知到客戶預算的銳減。
比如,公安系統(tǒng)的視頻監(jiān)控方案并非適用一般的零售商,“它本身使用是公安內網(wǎng),一個本地化的服務器集群,用物理服務器去承載所有的視頻流,服務對象的特性決定了方案的設計?!币晃灰曈X從業(yè)者表示。
普通零售商針對視頻監(jiān)控則必須考慮:第一,本地加服務器,購買服務器需要幾萬元,而且需要人維護,還要防止偷盜丟失破損;第二,云加端,視頻流傳到云端處理方案的網(wǎng)絡帶寬成本加云端GPU服務成本也不低,傳輸至少一個720P或者一個高清碼流,帶寬少說要4M,一個CPU服務器,大概阿里是500塊錢一年,GPU是3000塊錢一年;第三,壓縮視頻流上傳云端,會丟幀失真,效果很差。
“政府項目可以說不計成本,以達到最好的效果,這和商業(yè)的邏輯不一樣。
硬件占據(jù)方案成本中的大頭,包括GPU、相機以及各類感應器等。
后臺分析是店里配備小型硬件處理站還是走云端,包括私有云、公有云還是混合云,廠商們提供了開放選擇。圖普負責零售產品的劉凱解釋稱,上不上GPU由客戶需求決定,云端分析處理的好處是及時性更強,剛到店的客人馬上就能被識別出來,模型、程序的更新也是在云端完成,無需人工干預,但是對網(wǎng)絡傳輸要求高;本地化分析則幾乎不占用忙時帶寬,在本地分析完后再在閑時將分析結果上傳到服務器。
“根據(jù)客戶實際的需求以及資源的限制來做選擇,沒有最好的,只有最適合的?!眲P說。
相機有原本線下就在用的幾百塊的普通攝像頭,也有動輒上千的深度版,還有方案提供商自主設計的獨家產品。
普通相機是單目的,2D成像,而深度相機通過雙目或3D結構光或加紅外模組實現(xiàn)3D效果,也就可以知道物體離相機多遠,當然價格也更貴。
“我們現(xiàn)在用2D相機,通過算法模擬3D,當然,如果用深度相機模組可以更準,但成本太高了?!币晃划a品經理表示。
原有的設備可以用起來?!霸瓉硪呀浲顿Y過的東西我們不會進行破壞性的損傷,攝像頭我們要200萬像素以上就可以,原來超市里已有的攝像頭直接就可以用,并聯(lián)進我們的系統(tǒng)就可以?!吧泻}埍硎尽?/p>
圖普向天福超市提供的改造方案正復用了原有攝像頭,對接CRM系統(tǒng)拿到會員頭像和消費記錄,自動識別VIP,精準發(fā)送促銷廣告。
如何把握效果和成本之間的天平,是初來乍到玩家的必修課。
“如果不計成本的話,我們的精度早就上去了?!焙?4創(chuàng)始人林捷說。
簡24是Amazon Go的國內追隨者。Amazon Go由亞馬遜在2016年底發(fā)布,主打拿了就走、不需排隊的,引發(fā)業(yè)內震撼。今年年初,亞馬遜從內測正式向公眾開放,而經過兩年的時間,技術圈和零售圈的人也都意識到這只是個“show case”,實在不具備大規(guī)模復制可能性。
根據(jù)公開報道,Amazon Go在160平米的空間里布置了上百個攝像頭,RGB和深度攝像頭結合,并采用了紅外線感應器和重力感應器,盛傳成本高達千萬美金。
推出了2.0版本的林捷用的是“幾百塊“的普通攝像頭,也不能布置太多,依靠算法迭代來提升精度。
“還是要回到商業(yè)的本質,攝像頭的價格和數(shù)量肯定對效果有影響,但是在零售場景下,成本太高根本不能收回投資,這個商業(yè)模式就不成立了?!绷纸菡f。
懂零售
一套設計方案中,算法、硬件、 場景互相適配,構成一個完整的三角形。方案設計得是否符合“商業(yè)的邏輯”,很大程度上取決于對零售的理解程度。
零售是創(chuàng)新工場AI工程院今年的主打行業(yè),聯(lián)合創(chuàng)始人王晶表示,人工智能團隊當中要有行業(yè)專家,每次見客戶最長的時間花在了解對方的實際業(yè)務上。
劉凱告訴億邦動力網(wǎng),不同類型的零售商間差異會比較大,但即便同一類型的零售商客戶,在管理上的需求也存在很大差異。
“做家居的客戶會希望我們能按家庭的維度去識別客戶,而賣日用品的客戶可能更急迫于知道有哪些人是回頭客。在同類的零售商中,根據(jù)客戶自身管理目標的不同,共性的需求也會在指標要求上有差異,如對準確率、召回率的要求有所不同,差異化的個性化需求,未必在整個行業(yè)間通用?!眲P說。
王晶認為,方案的優(yōu)劣不僅取決于算法,很多時候是工程上的問題?!氨热?,要從用戶的整個流程體驗的角度考慮,怎樣有一個很好的結賬流程,讓用戶感覺更順暢,反之不管技術多炫酷,如果用戶不舒服,商家都不會買單的?!?/p>
深蘭在克制技術的無限延展?!肮褡涌梢灾谎b四個攝像頭或者六個攝像頭,攝像頭多了,GPU算力需求比較大,成本高。基本上你故意要偷也能偷走,但是問題是大多數(shù)人正常購買,而且如果貨少了,我們調取視頻也會發(fā)現(xiàn),還和其他公司共享信用,偷竊查出來后就上黑名單了?!标惡2ń榻B。
即便Amazon Go也有針對零售場景而變通的一面。其貨架使用的重力感應器其實存有隱患,理論上,小偷可以快速把商品替換成其他東西(比如一袋沙子)而不被發(fā)現(xiàn),不過考慮到這是多人同在的場景,類似的偷盜實施起來比較困難也就忽略了。
林捷總結出來一套經驗:不要讓技術花時間在運營能夠解決的問題上?!皫资畟€人擠在柜臺前結賬,這樣的場景就不要讓視覺科學家去研究了,機器分不清楚誰買了什么,就讓顧客排隊好了。”這些取舍建立在零售業(yè)的理解上,技術大咖補課不足就容易掉坑?!坝械?方案)為了做到更好的商品識別效果,會加高貨架的層高,降低層數(shù),一般貨架有5到6層,變成了4層。”林捷強調,這是損傷便利店平效的本末倒置,“如果了解零售,絕對不會在技術設計上犧牲平效的?!?/p>
商品識別方興未艾
要實現(xiàn)對人貨關系互動的記錄以及無人結算,繞不開談商品識別。這也是視覺科學家在爭奪的新高地,“前幾年我們刷榜刷的都是人臉,刷爛了,現(xiàn)在物體是最難的?!币晃粯I(yè)內人士透露。
去年,曠視參加了COCO競賽的物體檢測、人體關鍵點和物體分割三個單項比賽,獲得兩個第一和一個第二。碼隆科技取得了 WebVision競賽的第一名。
相比人臉識別,商品識別還徘徊在起跑線上。傳統(tǒng)商超、便利店和品牌店升級改造,都一般采用條形碼、RFID這些“老古董”技術,即便繽果盒子這樣的創(chuàng)新項目也啟用了RFID。
“因為RFID是一個比較偏成熟的方案,最早選擇它在創(chuàng)業(yè)上是make sense(說得通)的。圖像識別技術可能更領先、挑戰(zhàn)更大?!比A映資本投資總監(jiān)姜志峰說。
總得來說,人臉相對標準化,可以把人種作為單獨訓練模型,而零售涉及的商品SKU多而雜,每個類別單獨訓練難度大,不可控性更高。機器識別每張照片的基本邏輯是:每張照片有向量,即多組數(shù)字,某幾個組合起來代表袖長、顏色、款式等特征,機器根據(jù)數(shù)字判斷自己“看見”的是啥。但是,如衣服這種柔性物體易變形,不同穿法或者扭曲、折疊在圖片中像素排列不同,讓計算機明白它們是同一件的不同形態(tài)很難。
此外,現(xiàn)在人臉識別已經可以把算法做到手機里,比如刷臉解鎖,而物體識別暫時還要基于GPU或者X86這種高性能的硬件架構,成本較高。
“WebVision競賽上李飛飛給我們頒的獎。”碼隆創(chuàng)始人黃鼎龍強調。
和曠視不一樣,物體識別是碼隆們安身立命的根本。此外,國內市場上頭部玩家還有衣+、Visenze。
與人臉識別早早收割了安防的麥田不同,商品識別長時間以來被認為應用場景不明確,空有技術難變現(xiàn),玩家們在漫長的商業(yè)化探索中走出了不同的萬里長征。
三家業(yè)務都在電商上下了大力氣。碼隆和衣+最初做的都是以以圖搜圖為核心的to C產品,類似淘寶“拍立搜”,后來轉向2B服務,一個建立了Product AI平臺,將識別能力開放給電商平臺、品牌、圖庫等商家;另一個則鎖定了媒體和大屏等,比如,在優(yōu)酷視頻上即看即買,跳轉進入淘寶購物,即通過衣+的技術實現(xiàn)。
“線上的調用量在緩慢增長。”黃鼎龍說,從碼隆的經驗拉里看,線上市場有需求,但不會迅速爆發(fā)。為更快打開市場,碼隆還把精力投向商家后端,比如,利用圖像識別技術實現(xiàn)一鍵生成產品詳情頁功能。
黃鼎龍認為,經過幾年的數(shù)據(jù)積累和算法迭代,加之新零售風潮愈來愈熱鬧,商品識別應用于線下的機會到了。
“這個事情能不能成立取決于是否useable(可用的)和useful(有用的),一方面,在技術上要達到基本可用的狀態(tài),這是很重要的前提條件,別人試了不work就不行;另一方面,也得有用,17年隨著零售領域的(興起),大家開始覺得有用?!包S鼎龍說。
Yi+也在向線下零售進發(fā),無人店和快消品品牌是其目前主要客戶群體。“我們的數(shù)據(jù)積累,和客戶建立起的反饋機制,都是難以短時間跨越壁壘?!盰i+產品負責人說。
不過,Visenze的興趣還不大,它總部在新加坡,主要為海外客戶提供以圖搜圖技術,例如樂天、H&M等。
CTO李廣達認為,計算機視覺技術還沒有達到大范圍應用于實體零售的程度。“計算機視覺有mission critical(關鍵任務)和非mission critical兩種場景,區(qū)別在于效果的可信度。攝像頭解決方案可以一定程度上提升效率,但是有些場景還不能完全信任。”
他認為,電商環(huán)境的以圖搜圖是典型的非mission critical(關鍵任務)場景。盡管當涉及到一些細節(jié)屬性,比如顏色、領子類型、袖子長短等等,準確度會打折扣,但這可以慢慢打磨。
大而無當還是前途無量?
商品識別是不是真的“useful”,即能否商業(yè)化、是否值得研究尚存爭議。
圖普科技和商湯暫時都還未涉及。“廠商對這方面熱情還比較高,但可能需求不夠聚焦,如何深度結合實際業(yè)務還需要探討?!眲P說。圖為使用RFID的CITYBOX。

“商品的識別有一些創(chuàng)業(yè)公司在做,術業(yè)有專攻,市場這么大,我們做好自己的事情就好了。我個人判斷它(機器視覺識別商品)的價值意義沒那么大?!鄙泻}埥榻B稱,蘇寧Biu店賣球鞋、運動衣,感應電子標簽(RFID)即可結賬。
RFID在服裝行業(yè)尤其受到歡迎?!耙曈X技術可能在某些產品上取代RFID,服裝可能比較難。“馬克華菲CIO兼任電商總經理左敬東說。
馬克華菲有100多家智慧門店,商品配置RFID標簽,通過物聯(lián)網(wǎng)識別器,消費者試穿衣服時站到智能試衣鏡前,大屏可自動識別商品ID,向消費者展示模特試穿效果、產品介紹、評價、相關搭配等內容。
除了前端展示,RFID在后端零售庫存管理上優(yōu)勢明顯?!罢iT店進行庫存盤點,3000件衣服,2個人,原來需要半天到1天時間。利用RFID芯片,用掃描槍片式感應進行群讀掃描,1個人,僅需15分鐘就能完成全部盤點?!币鹇腹緟R美CMO肖海坤表示。
不過,RFID也有未解決的難題:每件商品都要加貼至少三四毛錢的標簽,人工和材料成本高,且遇金屬和液體等不識別或效果差。
除了機器視覺和RFID,市面上的還有消費者自己拿商品掃碼結賬、重力感應等方案。如下圖物美超市的自助收營臺。

“掃碼對商戶來說成本低且簡單,但建立在信用基礎上,盜損大,且顧客自己動手影響用戶體驗。重力感應是老技術在零售領域的新應用,無法判斷具體哪件商品,知道哪個貨架被動過。”
陳海波本人是機器視覺忠實擁護者,“未來商店一定是沒有營業(yè)員,商品、編碼、條形碼不存在,商品一定要能夠被遠距離非接觸識別。”
不單單是未來,也有人已然找到了細分場景的即時需求。
王晶認為不能用RFID的場景也是機器視覺的機會,比如蛋糕店,“蛋糕都是用盤盛的,怎么貼標簽?”還有超市的自助稱重機也可以改用視覺識別,因為“在顯示屏的一頁頁商品中區(qū)分查找蛇果和富士蘋果的體驗很差”。
國外還有專門從事快消品貨架識別的Trax,在全球50個國家有175個客戶,不乏可口可樂、百威、雀巢、漢高、百事這樣的大品牌,每月處理2.5億的SKU產品。
剛剛就任中國區(qū)負責人的王茜介紹,Trax已形成“交鑰匙”式解決方案:兩米多的貨架只需一個成本“幾美金”的攝像頭,品牌商使用手機拍照即可。
最基本的,品牌商銷售代表把貨架照片上傳至云端解析,監(jiān)督門店;零售商安裝固定攝像頭,實時監(jiān)測動態(tài)變化;也可以在冰箱上裝上小小的攝像頭,每開關一次拍攝一張照片,記錄銷售情況。Trax聲稱,服務的快消品公司斷貨率下降10%到15%,整體銷售業(yè)績提升3%到5%。
Trax核心市場在美國,今年1月正式進入中國,目標三年內中國市場年收入達到1億美元。
用視覺技術識別貨架商品在國內少見,土生土長的Yi+也打算深耕。“國內的快消公司相對傳統(tǒng),我們的本土優(yōu)勢比較明顯,而且以服飾和商品識別起步,在零售方面也有優(yōu)勢?!变N售負責人稱。
他表示,貨架識別在國內處于空白狀態(tài),快消品公司也有迫切需求?!八鼈円话阈枰虺谢蛘唛T店交納進場費,獲取貨架數(shù)據(jù)非常關鍵,很關心自己的貨擺得好不好,銷售量好不好,每天有什么變化,之前都沒辦法及時統(tǒng)計?!?/p>
當然,蛋糕店和超市愿不愿意買創(chuàng)新工場的視覺方案,Trax能不能賺到1億美元,Yi+能不能成功挖掘到本土客戶,這些都將被2018年所檢驗。
“我們希望通過AI降本增效,如果兩點都能做到的話,我們就會把它商業(yè)化落地,如果最后得出的結論是用視覺無法真的做到的話,可能就不會做類似的產品。頂多做點展示,表明我們有這個能力而已。”正在關注商品識別的計算機視覺產品經理說。
技術賣給誰?
陳海波喜歡向投資人就什么零售項目值得投提建議,他本身確實也在密切關注,因為這決定了技術要賣給誰。
他認為,AI技術提供方人力成本高昂,必須要接規(guī)?;捻椖?,而單個項目不值得投入?!叭绻蛻糸_一個店做秀,沒有意義的。我們要拿下市場,就必須找到具備成千上萬臺采購量的商家。我們的科學家很貴的,不值得為一次性項目投入?!?/p>
目前市場上的采購方從形態(tài)上看有貨架、冰柜、無人BOX創(chuàng)業(yè)公司,也有便利店、商超、賣場等傳統(tǒng)零售商,不同類型的門店客流量不同,SKU不同,需求也千差萬別。
無人店是市場上的主力買家,其核心需求在于離店的身份識別和收銀結算兩大項技術,以多金、舍得砸錢給技術公司留下深刻印象。
“互聯(lián)網(wǎng)公司是資本燒錢模式,重效果,不太講成本,要上最好的設備?!币晃划a品經理透露。
不過,陳海波放出話不愿意接無人BOX的活兒?!拔覀冋{研過,根本不賺錢,短期內也難以規(guī)?;_店,中國的零售店已經很多了,沒有那么大的市場空間,不是那么多地方需要。”
深蘭現(xiàn)在的業(yè)務重心在貨架和自動販賣機的改造上:增加視覺技術,即拿即走,解決盜損問題,把它們變成貨柜或者風幕柜,出售毛利率更高的鮮食、水果和便當。
參考日本市場,中國自動販賣機的潛力還未被完全激發(fā)。而貨架相比其他零售形態(tài)與消費者距離更短,也算進步。但是,技術方案商們對貨架智能化節(jié)點是否到達的看法還不統(tǒng)一:低門檻、弱技術的貨架正忙于搶位,真的有時間和金錢顧及把自己升級為智能化產品?
不可否認,創(chuàng)業(yè)公司愿意嘗試新技術,但技術也是它們區(qū)別于傳統(tǒng)玩家、立足市場的核心。簡24選擇自主研發(fā),繽果盒子也發(fā)布了以視覺、傳感器、超聲波多項技術替代RFID的解決方案,并聲稱已引入全球頂級人工智能專家,正與國內重點211院校合作共建國際人工智能實驗室。
一邊是火焰,另一邊則是冰山。
相比創(chuàng)業(yè)公司對新技術的熱情,傳統(tǒng)零售被吐槽“感興趣看看”、“掏錢欲望不強”。雖然此類玩家有大把的“試驗田”,但看過花花綠綠的PPT和demo視頻,再親自與技術提供方談一談,心便涼了。
當然,一位曾試圖采購視覺技術的品牌操盤手也抱怨:“幾平米地方的改造要好幾萬,還省不了一個員工,我干嘛要做?”
業(yè)內人士介紹,目前人工智能在降低成本和提升業(yè)績上還不能發(fā)揮顯著作用,難以被零售商真正地落地采購。原因在于,算法優(yōu)化是一個長周期的、需要“活數(shù)據(jù)”的過程:先有一套標準算法,然后找場景落地,之后數(shù)據(jù)回流,再對回流的數(shù)據(jù)做算法的差異化訓練。甚至有人推測,整個模型跑通至少需要三年時間。
“現(xiàn)階段零售業(yè)對視覺技術的認知還不足,預期或過高或過低,而前者占大多數(shù)?!盰i+產品負責人表示。
從算法模型優(yōu)化的角度講,傳統(tǒng)的連鎖商超、品牌店、便利店都是不錯的標的。無人店數(shù)量太少;賣場雖然規(guī)模大,但是洶涌的人流對機器運算造成不小壓力。
“說實話,現(xiàn)在的項目是賠錢做的,我們的目的還是和客戶一起成長?!币晃粡臉I(yè)者坦言。
“對于大部分AI公司來說,數(shù)據(jù)其實挺難拿的,一方面要有客戶愿意一起優(yōu)化,另一方面,投入的人力也相當可觀,需要研究人員來做單獨訓練?!傲硪晃粯I(yè)內人士說。
王晶表示,數(shù)據(jù)量太小的店不是早期階段最理想的案例,優(yōu)先從AI能夠帶來更大效應的連鎖店開始,而且線下門店在線化程度低,很多時候要重新開始積累數(shù)據(jù)?!坝械膫鹘y(tǒng)門店POS機版本太低,以前的數(shù)據(jù)都無法調取?!?/p>
AI公司通常被認為核心競爭點在于算法、數(shù)據(jù)和算力,而事實上落地能力也是重中之重?!安荒芎鲆暤氖牵脩舴答仚C制完善度非常重要,你多久拿到用戶新的反饋,從而修改你的方法,節(jié)奏是怎么樣的,有沒有建立自動的傳輸流程?!盰i+產品負責人稱。
這也意味著AI公司搶占市場的速度異常重要?!叭绻捌谟眉夹g優(yōu)勢解決一個商家比較著急的問題,建立起信任,然后大家一起優(yōu)化方案,如果這個流程開始跑起來,其他人進入就比較難?!?/p>
終極目標是分析預測
“前端獲取了數(shù)據(jù)之后的東西特別重要,可以幫助門店做銷量預測、選品建議、個性化營銷?!蓖蹙дf。
王晶表示,人工智能的作用不僅僅在于節(jié)省人力成本,而且可以把線下用戶行為轉為在線化的數(shù)據(jù),有了數(shù)據(jù)可以幫零售店主做更多的事情。
一位業(yè)內人士講解道,AI的落地分為感知、理解、推理關系三個環(huán)節(jié),直到可以告訴人該怎么做的時候才是AI真正有價值的時候。
王晶說,像7-11這樣的便利店選品很大程度上依賴于店長的個人經驗,以銷售數(shù)據(jù)為出發(fā)點,結合第二天的天氣和周邊環(huán)境等情況預判消費心理并訂貨,而人工智能可以綜合更多因素做出智能化決策。
“通過攝像機等傳感器,店主可以掌握消費者全流程的行為,消費者從進店起就被識別出了是誰,是不是會員,店內看了哪些東西,對哪些產品感興趣,在哪個區(qū)交互多,結賬時買走了什么東西?!?/p>
目前,市面上的視覺方案也引入了大量客戶分析功能,比如,客戶畫像、客流統(tǒng)計、熱點分析、動線規(guī)劃等等。
在圖普科技的一個公開案例中,某大型餐飲連鎖每天晚上在8點半組織營銷活動,經過圖普科技的重新統(tǒng)計尋找人流量最高的時段,圖普科技通過數(shù)據(jù)分析發(fā)現(xiàn)8點30分比8點45分差了10%的人流,比9點差了15%的人流?!巴瑯拥某杀就度肭闆r下,選錯了最有概率出現(xiàn)最多人的時間點,長此以往會有很大損失?!眻D普科技CEO李明強說。
基本各家官網(wǎng)和PPT都有類似的案例,但是也存在質疑:這些過渡性功能一定要通過視覺技術來解決嗎?
“客流分析不是這波視覺技術帶來的,十年前就有解決方案了?!币晃粯I(yè)內人士坦言。
比如,大型商場用AP采集數(shù)據(jù),統(tǒng)計客流數(shù)量,通過MAC地址反向做人群畫像。早在2014年銀泰就推廣智能機采集用戶身份,大數(shù)據(jù)公司據(jù)此提供標簽,從而實現(xiàn)精準營銷。
此外,紅外、藍牙、雙目視頻分析都是相對成熟的信息收集手段。
百安居去年在上海使用天貓的解決方案推出了首家智慧門店,公開信息中視覺技術中只有人臉識別,未提到對身體、動作的識別,而據(jù)天貓電器的高級專家吉家在演講中透露大量使用了藍牙定位技術?!霸谡麄€接近一萬平的場內放了很多藍牙,整個過程你在哪個模塊哪個區(qū)間關注什么都可能會被記錄?!?/p>
有業(yè)內人士表示,傳統(tǒng)方法在精度和顆粒度上不如視覺檢測,但憑借低成本可能會分流走客戶。
同時,現(xiàn)有視覺技術尚未給客流分析在效果上帶來質的提升,比如,熱點識別可以確定某個貨架或者區(qū)域人多,但又無法落實到具體商品上面。
“現(xiàn)在核心是要把數(shù)據(jù)收集起來,不在乎用的是更傳統(tǒng)的方法,還是說更高端。”Yi+產品負責人指出。
當然,視覺技術提供商也可以引入視覺以外的、已成熟的技術和產品。圖普科技的角色在向集成商靠攏,涉及畫像識別、滯留時長、跨天跨門店回訪識別、軌跡追蹤、熱力圖、自定義報表、支付人臉綁定等,也有完整的產品形態(tài),包括web,小程序和API接口。
集成商也是計算機視覺公司的一個發(fā)展方向,否則有可能成為CRM、POS等傳統(tǒng)零售服務商的一個分支而已。不過,集成商對客戶資源、整合能力要求很高,而且創(chuàng)新工場、阿里巴巴、騰訊等大玩家都在向其靠攏。
當然,總體而言,線下零售還只是大多視覺公司撒出去的眾多種子之一,金融、醫(yī)療、汽車等諸多行業(yè)也在開花結果,要不要真的扎根零售還沒有定論,畢竟圖普科技負責零售的產品和銷售大概二十個人,商湯的零售銷售只有兩人。
“現(xiàn)在是相互挑戰(zhàn)的過程,類似商湯這樣的公司與??抵g的關系,傳統(tǒng)集成商技術上有短板,但渠道和系統(tǒng)資源有優(yōu)勢。是單項技術發(fā)展成面,還是面補足技術,還挺難說的。”一位業(yè)內人士表示。