<source id="8ti10"></source>
  • <video id="8ti10"></video>
  • <source id="8ti10"></source>

        <u id="8ti10"><video id="8ti10"></video></u>
      1. 申請試用
        登錄
        核心技術
        以原創技術體系為根基,SenseCore商湯AI大裝置為核心基座,布局多領域、多方向前沿研究,
        快速打通AI在各個垂直場景中的應用,向行業賦能。

        港中文開源視頻動作分析庫MMAction,目標檢測庫算法大更新

        2019-06-20

        OpenMMLab 計劃是香港中文大學多媒體實驗室(MMLab)2018 年啟動的計劃,由香港中文大學教授、商湯科技聯合創始人林達華老師負責,初衷是「為計算機視覺的一些重要方向建立統一而開放的代碼庫,并不斷把新的算法沉淀其中。」

        2018 年 10 月,在 OpenMMLab 的首期計劃中,商湯和港中文正式開源了 mmdetection,這是一個基于 PyTorch 的開源目標檢測工具包。該工具包支持 Mask RCNN 等多種流行的檢測框架,讀者可在 PyTorch 環境下測試不同的預訓練模型及訓練新的檢測分割模型。

        昨日,林達華發表知乎文章,發布 OpenMMLab 第二期內容: 

        1. MMDetection(目標檢測庫)升級到 1.0,提供了一大批新的算法實現。

        2. MMAction(動作識別和檢測庫)全新發布。

        MMDetection 1.0

        Github 地址:open-mmlab/mmdetectiongithub.com 

        最新的 MMDetection 是 MMLab 聯合商湯科技以及十多個研究團隊合作完成的。據介紹,相較于其他開源數據庫,MMDetection 1.0 的優勢如下:

        1. 高度模塊化的設計。通過不同檢測算法流程的分解,形成一系列可定制的模塊。然后對這些模塊進行隨機組合,可以迅速搭建不同的檢測框架。

        2. 多種算法框架支持。MMDetection 直接支持多種主流的目標檢測與實例分割的算法框架,包括 single-stage、two-stage、multi-stage 等多種典型架構,以及各種新型模塊。此外,MMDetection 還提供了 200 多個預訓練的模型。

        3. 高計算性能。MMDetection 所支持的主要模塊均能在 GPU 上運行。整體的訓練速度優于 Detectron、maskrcnn-benchmark、以及 SimpleDet。特別值得一提的是,MMDetection 還直接支持混合精度訓練以及多卡聯合訓練,這些技術的引入都能顯著提高訓練的效率。

        4. 先進算法。MMDetection 提供了在 MSCOCO 2018 比賽中奪冠的 HTC 算法。隨著越來越多研究團隊加入到 mmdetection 的開發中,MMLab 研究團隊將持續保持和最新算法的同步。

        此外,MMLab 也發布了一份技術報告,對 MMDetection 進行了詳細介紹。

        5dbad6312676e.jpg

        從機構名稱中,我們可以發現 MMDetection 的發布聯合了國內外 13 所機構。

        報告鏈接:https://arxiv.org/abs/1901.11356

        該報告還提供了 MMDetection 與其他開源庫的對比,可以看到 MMDetection 提供的算法遠比其他開源庫豐富:

        5dbad64bd305a.jpg

        MMDetection 與其他開源庫的對比

        MMLab 的研究團隊還在 MMDetection 的基礎上對相關算法進行了全方位的對比試驗。他們比較了損失函數、歸一化策略、訓練尺度等一系列設計參數的選擇對于檢測性能的影響。

        視頻動作分析庫 MMAction

        林達華介紹道,「在深度學習剛剛開始進入計算機視覺領域的時候,MMLab 已經開始了對使用深度學習進行視頻動作分析的研究,提出了一系列有影響的算法框架。比如,我們在 ECCV 2016 提出的時序分段網絡(Temporal Segmental Network)已經被廣泛運用于實際系統中,并影響了很多新的算法設計。」

        基于過去幾年的探索,MMLab 建立了專門用于視頻動作分析的統一代碼庫 MMAction。

        項目地址:https://github.com/open-mmlab/mmaction

        據介紹,MMAction 有以下重要優點:

        1. 全面支持視頻動作分析的各種任務,包括動作識別(action recognition)、時域動作檢測(temporal action detection)以及時空動作檢測(spatial-temporal action detection)。

        2. 支持多種流行的數據集,包括 Kinetics、THUMOS、UCF101、ActivityNet、Something-Something、以及 AVA 等。

        3. 已實現多種動作分析算法框架,包括 TSN、I3D、SSN、以及新的 spatial-temporal action detection 方法。MMAction 還通過 Model Zoo 提供了多個預訓練模型,以及它們在不同數據集上的性能指標。

        4. 采用高度模塊化設計。用戶可以根據需要對不同模塊,比如 backbone 網絡、采樣方案等等進行靈活重組,以滿足不同的應用需要。



        <source id="8ti10"></source>
      2. <video id="8ti10"></video>
      3. <source id="8ti10"></source>

            <u id="8ti10"><video id="8ti10"></video></u>
          1. 动漫人物打扑克视频