導讀:場景文字檢測的發(fā)展歷程與很多計算機視覺方面的探究任務相類似,起初都是基于傳統(tǒng)的手工設(shè)計特征,但這一點在2014年左右發(fā)生了本質(zhì)變化,主要是人工智能深度學習方法的出現(xiàn)打破了之前的藩籬。
如今隨著人工智能深度學習的持續(xù)火熱,計算機視覺領(lǐng)域也發(fā)生了翻天覆地的變化,而場景文字檢測與識別作為其重要的研究課題之一,自然也不可避免被這股新科技浪潮所席卷。
其實場景文字這問題早在15-20年前就已經(jīng)被關(guān)注并研究,與傳統(tǒng)的文本文字檢測相比,其重要區(qū)別在于需要將照片或者視頻中的文字準確識別出來。
通常這個過程可以大致被理解為兩個步驟,首先需要對照片中存在文字的區(qū)域進行定位,也就是找到單詞或者文本的邊界框;第二步才是對定位到的文字進行精準識別。
總體來看,場景文字檢測的發(fā)展歷程與很多計算機視覺方面的探究任務相類似,起初都是基于傳統(tǒng)的手工設(shè)計特征,但這一點在2014年左右發(fā)生了本質(zhì)變化,主要是人工智能深度學習方法的出現(xiàn)打破了之前的藩籬。
但不容忽視的一點是,盡管強大的深度學習為該領(lǐng)域帶來了十足的推動力,但目前的場景文字識別與檢測還面臨數(shù)不清的挑戰(zhàn)。
例如,以文字顏色、大小、方向、字體等多變維度主導的場景文字多樣性為自然條件下的文字識別與檢測帶來了不小困難。日常生活中隨處可見的信號燈、指示標、柵欄、花草等局部與文字有一定相似性,這也為文字檢測與識別過程帶來很大干擾,等等。
發(fā)展至今,深度學習在不規(guī)則排列的文字檢測與識別方面仍然表現(xiàn)非常棘手,模型的泛化能力有限……以上統(tǒng)統(tǒng)都會成為深度學習亟需突破的障礙!
沒想到發(fā)展正旺的深度學習竟然有這么多坑坑洼洼,但開發(fā)者小伙伴們又對其如此“執(zhí)念”,腫么辦呢?別急,福利說到就到!
1月17日,由華為開發(fā)者聯(lián)盟舉辦的HUAWEI Developer Day系列沙龍活動19年第一站武漢站,有確切消息稱華中科技大學教授白翔將應邀亮相沙龍現(xiàn)場。
與會的開發(fā)者們不單能親眼看到久負盛名的技術(shù)大牛,還將全面了解最先進的深度學習方法,用于自然場景圖像中的文本識別與檢測,并評估其準確性與穩(wěn)定性等系列干貨。
另外,白翔教授還會就如何將深度學習方法有效地應用于從二維視角中檢索和識別具有任意形狀的拉丁文和非拉丁文,并結(jié)合成功的場景文本閱讀應用分析以及潛在研究方向做出預測等方面進行深入探討,如此有料的學習內(nèi)容,還等什么?
當然,除了涉及深度學習技術(shù)的透徹交流之外,本次武漢站沙龍活動,華為開發(fā)者聯(lián)盟還攜以下干貨亮點來襲,都有哪些閃亮之處需要畫圈圈呢?
深挖“時髦”的AI、AR/VR能力,打造酷炫應用不再難!關(guān)于諸多前沿技術(shù),華為的多位高級架構(gòu)師將在本次活動中,通過成功并詳盡的應用案例,為到場的開發(fā)者深入講述AI、AR/VR、快應用等最新技術(shù),幫助開發(fā)者們理解與應用,完成打造酷炫應用的終極目標。
全面解讀創(chuàng)新生態(tài),智慧分發(fā)、直達所需不是夢!
關(guān)于如何通過華為快服務平臺的智慧分發(fā)技術(shù)手段獲取更多流量,并同時在競爭激烈的市場中成功探索流量新風口?對于這個開發(fā)者們普遍get的問題,現(xiàn)場華為高級產(chǎn)品經(jīng)理將從全方位、多角度解讀終端新生態(tài)服務體系,幫助開發(fā)者提高推廣效率,提供更便捷、更優(yōu)化的體驗,惠及開發(fā)者,一個都不能少!
P20+榮耀手環(huán),豪華大禮驚喜怎能間斷?每位報名成功并且是前300位到現(xiàn)場開發(fā)者都會獲得一份精美的伴手禮,同時還可現(xiàn)場體驗AI、AR、快應用等創(chuàng)新業(yè)務。令人欣喜的是,議題間隙還會抽取華為P20、榮耀手環(huán)等豪華大禮!
HUAWEI Developer Day系列沙龍活動作為一個與廣大開發(fā)者深度交流的平臺,自上線以來,主要通過主題討論、熱門技術(shù)解讀、行業(yè)大咖案例分享等多重形式,圍繞最新技術(shù)和產(chǎn)品形態(tài),將華為的最新開放能力及服務賦能給互聯(lián)網(wǎng)開發(fā)者,同時還將最新行業(yè)動向及趨勢傳傳遞給最需要的人。
不論是資深開發(fā)者,抑或是開發(fā)新手,哪怕是對終端推廣新形態(tài)感興趣的運營經(jīng)理……統(tǒng)統(tǒng)都可以參與其中,提升能力、受益頗多。
武漢站近在眼前!
這里有深度學習大牛的前沿技術(shù)分享;
這里有航班管家設(shè)計總監(jiān)帶來的精彩應用;
這里有華為最新的創(chuàng)新生態(tài)解讀;
這里有炫酷時髦而又可行的技術(shù)……
面對如此一場充滿楚風情結(jié)的AI技術(shù)的饕餮盛宴,你怎能不心動?
所以心動總不如行動!
從即日起到1月16日15:00,本場HUAWEI Developer Day武漢站沙龍的報名通道將持續(xù)暢通,并于1月17日正式在武漢上線啟動。
想?yún)⒓?很簡單,直接登陸華為開發(fā)者聯(lián)盟官網(wǎng)。