物體識別_目標檢測_物體識別技術_SenseTime

核心技術: 以原創技術體係為根基，SenseCore商湯AI大裝置為核心基座，佈局多領域、多方向前沿研究，快速打通AI在各個垂直場景中的應用，向行業賦能。

首頁>核心技術 >

技術能力: SenseCore商湯AI大裝置智能汽車技術通用人工智能 AR增強現實智能內容形成人工智能決策智能內容增強醫學圖像分析

通用人工智能

關鍵技術

01物體檢測
02關鍵點定位
03身份驗證
04屬性識別
05圖像聚類
06真人檢測
07肖像美顏
08車型識別
09場景識別
10遙感圖像解譯
11服裝屬性識別
12視頻摘要
13視頻內容結構化
14短視頻標簽
15文字識別
16語音識別
17自然語言處理
18機器人控制與傳感

01 / 018

物體檢測

運用商湯科技領先全球的通用物體檢測算法，能有效地檢測出圖片中常見的物體。

02 / 018

關鍵點定位

可以支持不同精準度的面部關鍵點定位，快速(以毫秒計算)為眼、口、鼻等面部輪廓的21、106、240 個關鍵點定位。除此以外，它亦可定位移動端 14 個身體關鍵點，只要通過 RGB 圖像輸入，即可實時為頭、肩、腰和腿的位置定位，並可適用於各種大幅度的動作，根據不同實際環境中作出變化，包括不同角度的側臉、不同表情的變化、遮擋、模糊以及明暗的變化等等。

03 / 018

身份驗證

可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率，準確度超過99%。

04 / 018

屬性識別

準確地識別多種屬性類別，例如顏色、形狀、類型、性別和表情等。

05 / 018

圖像聚類

支持快速圖像聚類，例如用於智能相冊，更方便管理照片。

06 / 018

真人檢測

通過分辨高清照片、PS圖、3D模型和換臉等不同的仿冒方式，可以有效的檢測攝像頭前的用戶是否為真人操作。我們更可針對不同場景的需求提供定製化的解決方案，例如可配合身份認證能力，為金融等高安全性要求的嚴肅應用場景提供真人身份驗證。

07 / 018

肖像美顏

運用商湯科技智能圖像內容檢測定位技術，打造移動端美顏、美妝效果的解決方案，讓當今移動互聯網的時代更有娛樂性，更有“美”可依。

08 / 018

車型識別

實現各種場景下都可精準識別到大量各式各樣的車型，克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018

場景識別

精準地識別自然環境下的數百種場景以及上至千種通用物體及其屬性，方便智能相冊基於場景或者物體的內容進行管理、照片檢索和分類、甚至廣告推薦的功能。

10 / 18

遙感圖像解譯

實現對高空間、時間分辨率衛星影像智能化信息提取，面向土地利用類型分類與典型地物提取，點狀、面狀目標檢測和動態變化監測三大任務。

11 / 18

服裝屬性識別

自動檢測和識別圖片、視頻中的服飾，準確識別服飾品類、花紋、袖型、領型等特征，顯著抵抗光照與姿態變化等干擾因素的影響。

12 / 18

視頻摘要

基于原創的深度學習算法，智能分析長視頻中每個鏡頭的內容和風格，找出各鏡頭中的場景和活動等的內在聯系，提煉并匯集重點信息，以短視頻形式呈現，已經應用于電視、互聯網等行業。

13 / 18

視頻內容結構化

通過自動分析和提取視頻中的有價值素材（比如時尚服飾、場景、商標、商品和行為等），提供豐富的結構化信息，可用于高效的視頻素材管理和精準營銷。

14 / 18

短視頻標簽

基于業內領先的大規模多標簽算法，自動理解視頻的內容，自動生成文本標簽，幫助提升視頻搜索和推薦的精準度。擁有完善的標簽體系，已經落地于移動互聯網、電視、廣告等多個行業。

15 / 18

文字識別

a）自然場景類：自動提取復雜的自然場景圖片中的文字信息。
b）卡證類：在各種拍攝環境下，自動提取卡證圖像中的文字信息。
c）票據類：提供不限版式的多種類票據的識別，并根據所在位置自動組織結構。

16 / 18

語音識別

a) 語音識別：自動將音頻內容轉化為文字信息。
b) 關鍵詞檢測：處于休眠狀態下的設備通過喚醒直接進入語音交互，或者通過指令詞識別控制智能設備。
c) 聲紋識別：通過獨特的音頻特征識別和確認說話人身份。

17 / 18

自然語言處理

a) 自然語言理解和生成：文本表示學習，基于知識的語義理解，可控的文本生成等方向。
b) 對話系統：任務導向型對話系統，知識問答多輪對話系統。

18 / 18

機器人控制與傳感

a) 機器人仿真平臺：
利用機器人仿真平臺靈活改變實驗設置，快速獲取所需數據，從而對自主抓取策略與機器學習算法進行有效測試和驗證。仿真平臺采用模塊化的架構，關鍵模塊可根據應用需要進行更新和替換，仿真中的關鍵數據可存取。
b) 3D視覺引導的機器人隨機分揀技術：
通過分析 3D 視覺信號精確估計復雜場景中堆疊物體的 6D 姿態，通過碰撞檢測和運動規劃算法引導機器人以指定的方式抓取堆疊狀態下的目標物體。此核心技術可以應用于工業柔性生產裝配、上下料、物流分揀、碼垛、拆垛等行業領域。
c) 視覺驅動的機械臂物體操作技術：
通過深度學習和強化學習方法使機械臂可以進行自主學習。基于視覺傳感器驅動的多物體操作任務（如物體的抓取、放置和零件裝配）可以有效地降低硬件和系統集成成本。同時，算法可以在仿真環境下采集訓練樣本然后遷移至現實環境，從而減少現場調試開銷。此項技術提升了機器人在定制化產品智能工業生產線以及多品類物體的物流分揀等工業場景中的靈活性。

通用人工智能

物體檢測
關鍵點定位
身份驗證
屬性識別
圖像聚類
真人檢測
肖像美顏
車型識別
場景識別
遙感圖像解譯
服裝屬性識別
視頻摘要
視頻內容結構化
短視頻標簽
文字識別
語音識別
自然語言處理
機器人控制與傳感

01 / 018

物體檢測

運用商湯科技領先全球的通用物體檢測算法，能有效地檢測出圖片中常見的物體。

02 / 018

關鍵點定位

03 / 018

身份驗證

可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率，準確度超過99%。

04 / 018

屬性識別

準確地識別多種屬性類別，例如顏色、形狀、類型、性別和表情等。

05 / 018

圖像聚類

支持快速圖像聚類，例如用於智能相冊，更方便管理照片。

06 / 018

真人檢測

07 / 018

肖像美顏

運用商湯科技智能圖像內容檢測定位技術，打造移動端美顏、美妝效果的解決方案，讓當今移動互聯網的時代更有娛樂性，更有“美”可依。

08 / 018

車型識別

實現各種場景下都可精準識別到大量各式各樣的車型，克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018

場景識別

10 / 18

遙感圖像解譯

實現對高空間、時間分辨率衛星影像智能化信息提取，面向土地利用類型分類與典型地物提取，點狀、面狀目標檢測和動態變化監測三大任務。

11 / 18

服裝屬性識別

自動檢測和識別圖片、視頻中的服飾，準確識別服飾品類、花紋、袖型、領型等特征，顯著抵抗光照與姿態變化等干擾因素的影響。

12 / 18

視頻摘要

13 / 18

視頻內容結構化

14 / 18

短視頻標簽

15 / 18

文字識別

16 / 18

語音識別

17 / 18

自然語言處理

a) 自然語言理解和生成：文本表示學習，基于知識的語義理解，可控的文本生成等方向。
b) 對話系統：任務導向型對話系統，知識問答多輪對話系統。

18 / 18

機器人控制與傳感

您可能感興趣的頻道

商務合作

申請試用

體驗商湯科技的產品和服務，填寫簡短表格我們盡快聯系您

申請試用

合作夥伴招募

成為合作夥伴，與商湯科技共同推動 AI 在各行業的應用落地。

合作夥伴招募

您尚未完善信息

完善信息后，即可下載資料

完善信息跳過，繼續瀏覽

請選擇您認為需要改進的地方：

導航不好用，不方便找到感興趣的內容
產品介紹信息不夠全面
產品介紹信息不容易懂
頁面打開速度不快，頁面瀏覽不流暢/有卡頓
頁面不夠美觀
售后服務不好找，體驗不好

跳過下一個

您是否能夠達到本次網站的訪問目的？

是
否
仍在進行中

下一個

您對商湯官網的滿意度如何？

非常不滿意非常滿意

提交

已收到您對商湯官網的評價和建議！

感謝您的耐心反饋~

關閉

申請試用

推薦閱讀

申請試用

了解所有案例

了解所有產品服務

申請試用

了解所有案例

了解所有產品服務

申請試用

了解所有案例

了解所有產品

申請試用

了解所有案例

了解所有產品

申請試用

了解所有案例

了解所有產品

申請試用

了解所有案例

了解所有產品

了解所有案例

了解所有產品服務

申請試用

物體檢測

關鍵點定位

身份驗證

屬性識別

圖像聚類

真人檢測

肖像美顏

車型識別

場景識別

遙感圖像解譯

服裝屬性識別

視頻摘要

視頻內容結構化

短視頻標簽

文字識別

語音識別

自然語言處理

機器人控制與傳感

物體檢測

關鍵點定位

身份驗證

屬性識別

圖像聚類

真人檢測

肖像美顏

車型識別

場景識別

遙感圖像解譯

服裝屬性識別

視頻摘要

視頻內容結構化

短視頻標簽

文字識別

語音識別

自然語言處理

機器人控制與傳感

申請試用

合作夥伴招募

您尚未完善信息

請選擇您認為需要改進的地方：

您是否能夠達到本次網站的訪問目的？

您對商湯官網的滿意度如何？

已收到您對商湯官網的評價和建議！