- 核心技術
- 以原創技術體係為根基,SenseCore商湯AI大裝置為核心基座,佈局多領域、多方向前沿研究,快速打通AI在各個垂直場景中的應用,向行業賦能。
- 01物體檢測
- 02關鍵點定位
- 03身份驗證
- 04屬性識別
- 05圖像聚類
- 06真人檢測
- 07肖像美顏
- 08車型識別
- 09場景識別
- 10遙感圖像解譯
- 11服裝屬性識別
- 12視頻摘要
- 13視頻內容結構化
- 14短視頻標簽
- 15文字識別
- 16語音識別
- 17自然語言處理
- 18機器人控制與傳感
01 / 018
物體檢測
運用商湯科技領先全球的通用物體檢測算法,能有效地檢測出圖片中常見的物體。

02 / 018
關鍵點定位
可以支持不同精準度的面部關鍵點定位,快速(以毫秒計算)為眼、口、鼻等面部輪廓的21、106、240 個關鍵點定位。除此以外,它亦可定位移動端 14 個身體關鍵點,只要通過 RGB 圖像輸入,即可實時為頭、肩、腰和腿的位置定位,並可適用於各種大幅度的動作,根據不同實際環境中作出變化,包括不同角度的側臉、不同表情的變化、遮擋、模糊以及明暗的變化等等。

03 / 018
身份驗證
可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率,準確度超過99%。

04 / 018
屬性識別
準確地識別多種屬性類別,例如顏色、形狀、類型、性別和表情等。

05 / 018
圖像聚類
支持快速圖像聚類,例如用於智能相冊,更方便管理照片。

06 / 018
真人檢測
通過分辨高清照片、PS圖、3D模型和換臉等不同的仿冒方式,可以有效的檢測攝像頭前的用戶是否為真人操作。我們更可針對不同場景的需求提供定製化的解決方案,例如可配合身份認證能力,為金融等高安全性要求的嚴肅應用場景提供真人身份驗證。

07 / 018
肖像美顏
運用商湯科技智能圖像內容檢測定位技術,打造移動端美顏、美妝效果的解決方案,讓當今移動互聯網的時代更有娛樂性,更有“美”可依。

08 / 018
車型識別
實現各種場景下都可精準識別到大量各式各樣的車型,克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018
場景識別
精準地識別自然環境下的數百種場景以及上至千種通用物體及其屬性,方便智能相冊基於場景或者物體的內容進行管理、照片檢索和分類、甚至廣告推薦的功能。

10 / 18
遙感圖像解譯
實現對高空間、時間分辨率衛星影像智能化信息提取,面向土地利用類型分類與典型地物提取,點狀、面狀目標檢測和動態變化監測三大任務。

11 / 18
服裝屬性識別
自動檢測和識別圖片、視頻中的服飾,準確識別服飾品類、花紋、袖型、領型等特征,顯著抵抗光照與姿態變化等干擾因素的影響。

12 / 18
視頻摘要
基于原創的深度學習算法,智能分析長視頻中每個鏡頭的內容和風格,找出各鏡頭中的場景和活動等的內在聯系,提煉并匯集重點信息,以短視頻形式呈現,已經應用于電視、互聯網等行業。

13 / 18
視頻內容結構化
通過自動分析和提取視頻中的有價值素材(比如時尚服飾、場景、商標、商品和行為等),提供豐富的結構化信息,可用于高效的視頻素材管理和精準營銷。

14 / 18
短視頻標簽
基于業內領先的大規模多標簽算法,自動理解視頻的內容,自動生成文本標簽,幫助提升視頻搜索和推薦的精準度。擁有完善的標簽體系,已經落地于移動互聯網、電視、廣告等多個行業。

15 / 18
文字識別
a)自然場景類:自動提取復雜的自然場景圖片中的文字信息。
b)卡證類:在各種拍攝環境下,自動提取卡證圖像中的文字信息。
c)票據類:提供不限版式的多種類票據的識別,并根據所在位置自動組織結構。

16 / 18
語音識別
a) 語音識別:自動將音頻內容轉化為文字信息。
b) 關鍵詞檢測:處于休眠狀態下的設備通過喚醒直接進入語音交互,或者通過指令詞識別控制智能設備。
c) 聲紋識別:通過獨特的音頻特征識別和確認說話人身份。

17 / 18
自然語言處理
a) 自然語言理解和生成:文本表示學習,基于知識的語義理解,可控的文本生成等方向。
b) 對話系統:任務導向型對話系統,知識問答多輪對話系統。

18 / 18
機器人控制與傳感
a) 機器人仿真平臺:
利用機器人仿真平臺靈活改變實驗設置,快速獲取所需數據,從而對自主抓取策略與機器學習算法進行有效測試和驗證。仿真平臺采用模塊化的架構,關鍵模塊可根據應用需要進行更新和替換,仿真中的關鍵數據可存取。
b) 3D視覺引導的機器人隨機分揀技術:
通過分析 3D 視覺信號精確估計復雜場景中堆疊物體的 6D 姿態,通過碰撞檢測和運動規劃算法引導機器人以指定的方式抓取堆疊狀態下的目標物體。此核心技術可以應用于工業柔性生產裝配、上下料、物流分揀、碼垛、拆垛等行業領域。
c) 視覺驅動的機械臂物體操作技術:
通過深度學習和強化學習方法使機械臂可以進行自主學習。基于視覺傳感器驅動的多物體操作任務(如物體的抓取、放置和零件裝配)可以有效地降低硬件和系統集成成本。同時,算法可以在仿真環境下采集訓練樣本然后遷移至現實環境,從而減少現場調試開銷。此項技術提升了機器人在定制化產品智能工業生產線以及多品類物體的物流分揀等工業場景中的靈活性。

- 物體檢測
- 關鍵點定位
- 身份驗證
- 屬性識別
- 圖像聚類
- 真人檢測
- 肖像美顏
- 車型識別
- 場景識別
- 遙感圖像解譯
- 服裝屬性識別
- 視頻摘要
- 視頻內容結構化
- 短視頻標簽
- 文字識別
- 語音識別
- 自然語言處理
- 機器人控制與傳感
01 / 018
物體檢測
運用商湯科技領先全球的通用物體檢測算法,能有效地檢測出圖片中常見的物體。

02 / 018
關鍵點定位
可以支持不同精準度的面部關鍵點定位,快速(以毫秒計算)為眼、口、鼻等面部輪廓的21、106、240 個關鍵點定位。除此以外,它亦可定位移動端 14 個身體關鍵點,只要通過 RGB 圖像輸入,即可實時為頭、肩、腰和腿的位置定位,並可適用於各種大幅度的動作,根據不同實際環境中作出變化,包括不同角度的側臉、不同表情的變化、遮擋、模糊以及明暗的變化等等。

03 / 018
身份驗證
可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率,準確度超過99%。

04 / 018
屬性識別
準確地識別多種屬性類別,例如顏色、形狀、類型、性別和表情等。

05 / 018
圖像聚類
支持快速圖像聚類,例如用於智能相冊,更方便管理照片。

06 / 018
真人檢測
通過分辨高清照片、PS圖、3D模型和換臉等不同的仿冒方式,可以有效的檢測攝像頭前的用戶是否為真人操作。我們更可針對不同場景的需求提供定製化的解決方案,例如可配合身份認證能力,為金融等高安全性要求的嚴肅應用場景提供真人身份驗證。

07 / 018
肖像美顏
運用商湯科技智能圖像內容檢測定位技術,打造移動端美顏、美妝效果的解決方案,讓當今移動互聯網的時代更有娛樂性,更有“美”可依。

08 / 018
車型識別
實現各種場景下都可精準識別到大量各式各樣的車型,克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018
場景識別
精準地識別自然環境下的數百種場景以及上至千種通用物體及其屬性,方便智能相冊基於場景或者物體的內容進行管理、照片檢索和分類、甚至廣告推薦的功能。

10 / 18
遙感圖像解譯
實現對高空間、時間分辨率衛星影像智能化信息提取,面向土地利用類型分類與典型地物提取,點狀、面狀目標檢測和動態變化監測三大任務。

11 / 18
服裝屬性識別
自動檢測和識別圖片、視頻中的服飾,準確識別服飾品類、花紋、袖型、領型等特征,顯著抵抗光照與姿態變化等干擾因素的影響。

12 / 18
視頻摘要
基于原創的深度學習算法,智能分析長視頻中每個鏡頭的內容和風格,找出各鏡頭中的場景和活動等的內在聯系,提煉并匯集重點信息,以短視頻形式呈現,已經應用于電視、互聯網等行業。

13 / 18
視頻內容結構化
通過自動分析和提取視頻中的有價值素材(比如時尚服飾、場景、商標、商品和行為等),提供豐富的結構化信息,可用于高效的視頻素材管理和精準營銷。

14 / 18
短視頻標簽
基于業內領先的大規模多標簽算法,自動理解視頻的內容,自動生成文本標簽,幫助提升視頻搜索和推薦的精準度。擁有完善的標簽體系,已經落地于移動互聯網、電視、廣告等多個行業。

15 / 18
文字識別
a)自然場景類:自動提取復雜的自然場景圖片中的文字信息。
b)卡證類:在各種拍攝環境下,自動提取卡證圖像中的文字信息。
c)票據類:提供不限版式的多種類票據的識別,并根據所在位置自動組織結構。

16 / 18
語音識別
a) 語音識別:自動將音頻內容轉化為文字信息。
b) 關鍵詞檢測:處于休眠狀態下的設備通過喚醒直接進入語音交互,或者通過指令詞識別控制智能設備。
c) 聲紋識別:通過獨特的音頻特征識別和確認說話人身份。

17 / 18
自然語言處理
a) 自然語言理解和生成:文本表示學習,基于知識的語義理解,可控的文本生成等方向。
b) 對話系統:任務導向型對話系統,知識問答多輪對話系統。

18 / 18
機器人控制與傳感
a) 機器人仿真平臺:
利用機器人仿真平臺靈活改變實驗設置,快速獲取所需數據,從而對自主抓取策略與機器學習算法進行有效測試和驗證。仿真平臺采用模塊化的架構,關鍵模塊可根據應用需要進行更新和替換,仿真中的關鍵數據可存取。
b) 3D視覺引導的機器人隨機分揀技術:
通過分析 3D 視覺信號精確估計復雜場景中堆疊物體的 6D 姿態,通過碰撞檢測和運動規劃算法引導機器人以指定的方式抓取堆疊狀態下的目標物體。此核心技術可以應用于工業柔性生產裝配、上下料、物流分揀、碼垛、拆垛等行業領域。
c) 視覺驅動的機械臂物體操作技術:
通過深度學習和強化學習方法使機械臂可以進行自主學習。基于視覺傳感器驅動的多物體操作任務(如物體的抓取、放置和零件裝配)可以有效地降低硬件和系統集成成本。同時,算法可以在仿真環境下采集訓練樣本然后遷移至現實環境,從而減少現場調試開銷。此項技術提升了機器人在定制化產品智能工業生產線以及多品類物體的物流分揀等工業場景中的靈活性。
