您的位置:首頁 >城市 >

厚積薄發(fā),技術(shù)研發(fā)實力顯現(xiàn),視源股份團隊包攬多項ICDAR 2023冠亞軍

2023-06-13 16:37:37 來源:實況網(wǎng)

ICDAR(International Conference on Document Analysis and Recognition,國際文檔分析與識別會議)是文檔圖像分析領(lǐng)域最重要的國際會議之一。今年ICDAR設(shè)立了十余項競賽,吸引了來自谷歌、亞馬遜、百度、阿里、騰訊、北京大學(xué)、清華大學(xué)等諸多國內(nèi)外頂級科技公司和知名高校參加。

國際頂級賽事,包攬多項佳績

此次大賽中,視源股份團隊在BDVT-QA的端到端視頻文字識別任務(wù)中獲得第一名(V-DA)。

在CROHME手寫公式識別賽事的三項任務(wù)——在線公式識別(On-line recognition)、離線公式識別(Off-line recognition)、雙模態(tài)公式識別(Bimodal recognition)均獲得第二名(YP_OCR)。

手寫公式識別結(jié)果

文字識別與公式識別的競賽任務(wù)與視源股份在教育領(lǐng)域布局的業(yè)務(wù)技術(shù)息息相關(guān),據(jù)悉當(dāng)前這些技術(shù)已廣泛應(yīng)用在seewo學(xué)習(xí)機的作業(yè)批改、口算計算等產(chǎn)品中。隨著底層技術(shù)。的成熟和優(yōu)化,視源股份旗下品牌的產(chǎn)品性能和用戶體驗有極大提升贏得良好的口碑。

多領(lǐng)域開花,技術(shù)實力顯現(xiàn)

當(dāng)前大眾對于視源股份的印象仍然停留在售賣“顯示器”階段,其實視源股份一直在積極組建自己的技術(shù)團隊,并在多年前成立中央研究院。

中央研究院創(chuàng)立之初旨在為視源股份技術(shù)促增長戰(zhàn)略提供強力支撐,當(dāng)前中央研究院博士學(xué)歷研究人員占比25%,主要圍繞視覺計算、語音信號信息處理、觸覺技術(shù)、空間感知、自然語言處理、醫(yī)學(xué)信號處理、數(shù)據(jù)挖掘等領(lǐng)域進行研究,目前團隊已有來自UCLA、清華、中科院、Apple等海內(nèi)外高層次人才。

今年視源股份中央研究院數(shù)據(jù)挖掘團隊(CVTEDMer)還參與了華為因果推理挑戰(zhàn)賽(PCIC),經(jīng)過線上篩選和決賽答辯最終取得線上第1名、決賽答辯總成績第2名的好成績。

從2018年開始,視源股份中央研究院各個研究團隊開始參與各類技術(shù)比賽,雄厚實力斬獲多項殊榮。

以下為視源股份中央研究院團隊部分獲獎經(jīng)歷:

全國知識圖譜與語義計算大會 評測任務(wù):面向音樂領(lǐng)域的命令理解任務(wù)(第3名,2018)

阿里天池:“數(shù)智教育”數(shù)據(jù)可視化創(chuàng)新大賽(第1名,2019)

ACM MM Challenge AI Meets Beauty(第3名,2019)

阿里天池:第二屆海南大數(shù)據(jù)創(chuàng)新應(yīng)用大賽-智能算法-簡歷解析賽(第5名,2020)

2021 年訊飛 AI 開發(fā)者大賽-試題標(biāo)簽預(yù)測挑戰(zhàn)賽(第2名,2021)

CCL 2022漢語學(xué)習(xí)者文本糾錯競賽(賽道一第3名、賽道四第2名,2022)……

著眼大局,積極布局多模態(tài)感知和交互

視源股份中央研究院的研究方向覆蓋領(lǐng)域廣泛,縱觀技術(shù)的發(fā)展趨勢,結(jié)合團隊的優(yōu)勢研究領(lǐng)域,當(dāng)前他們正在深耕研發(fā)、積極布局多模態(tài)感知和交互技術(shù)。

隨著互聯(lián)網(wǎng)技術(shù)以及電商潮流的興起,AR技術(shù)在虛擬試衣的應(yīng)用越來越火爆。針對當(dāng)前網(wǎng)絡(luò)購物無法體驗衣物材質(zhì)的痛點和消費者對未來網(wǎng)購的消費期望,視源股份提前布局并深耕紋理反饋技術(shù),并由此延伸,挖掘紋理反饋更多的應(yīng)用場景。

近些年來手勢控制依靠自然、高效、便捷的優(yōu)勢不斷出現(xiàn)在各類操作應(yīng)用中,消費者們尤其贊賞手勢隔空操作、不直接接觸物體的安全特性。視源股份依靠研究優(yōu)勢對手勢交互進行深度研發(fā),力求應(yīng)用在更多場景、領(lǐng)域、設(shè)備中,刷新人們對于多模態(tài)的交互體驗。

視覺是人類的重要知覺——定位、識別物體、了解環(huán)境甚至是辨別面部表情等都是其承載的功能,視源股份中央研究院以“看清世界 看懂世界”為方針,在醫(yī)學(xué)影像、3D場景感知、虛擬人、情感智能等垂直領(lǐng)域進行深度探索,致力打造更加多元化的視覺研究和應(yīng)用。

在白熱化的語音交互賽道,視源結(jié)合業(yè)務(wù)場景對拾音模塊進行深入研究,顯著提升了課堂和會議場景下的音頻拾音質(zhì)量;通過對語音識別和語義理解方向的研究實現(xiàn)了技術(shù)方案平臺化,可為各類智能終端設(shè)備提供更便捷且睿智的語音交互。

依托于中央研究院對于基礎(chǔ)技術(shù)及應(yīng)用技術(shù)的深層次研究和實踐經(jīng)驗,視源股份當(dāng)前已在多個新興領(lǐng)域進行戰(zhàn)略孵化。視源股份始終在積極營造進取、包容和開放的科研環(huán)境,緊跟前沿技術(shù)的趨勢,大力推進研究成果在未來教育、企業(yè)服務(wù)、智能硬件、健康醫(yī)療等領(lǐng)域的落地轉(zhuǎn)化,期待充分實現(xiàn)技術(shù)的產(chǎn)業(yè)價值和社會價值,繼續(xù)通過科技創(chuàng)新將夢想變成現(xiàn)實。

 

標(biāo)簽: