AI / ML / NN
============
.. toctree::
:hidden:
model_conversion.rst
tutorials/pretrained_openvino.rst
tutorials/local_convert_openvino.rst
`OAK Camera `__ 可以 **运行任何 AI 模型**, 甚至是自定义架构/构建的模型。您甚至可以同时运行多个 AI 模型,并行或串行(`此处为演示 `__)。
要在设备上运行自定义 AI 模型, 您需要 **将其转换** 成 :code:`.blob` 格式 - :ref:`文档在此处 <将模型转换为MyriadX blob>`.
您还可以选择使用来自 `OpenVINO Model Zoo `__
或 `DepthAI Model Zoo `__ 的 **250多个预训练AI模型之一** , 请参阅 :ref:`使用预训练的 OpenVINO 模型` 了解更多信息。
模型性能
#################
您可以借助下表估计模型的性能。它包含依赖于 FLOP 和参数的 OAK 设备上模型的 FPS 估计。
.. image:: /_static/images/fps_models.png
`您可以在此表 `__ 中找到更详细的通用模型 FPS评估。
AI视觉任务
###############
我们为许多不同的AI视觉任务提供开源示例和演示,例如:
- **Object detection** 模型提供所有检测到的对象的边界框、置信度和标签。 示例: `MobileNet `__, `Yolo `__, `EfficientDet `__, `Palm detection `__.
- **Landmark detection** 模型提供对象的特征/关键点。 示例: `Human pose `__, `hand landmarks `__, and `facial landmarks `__.
- **Semantic segmentation** 模型为每个像素提供标签/类别。 示例: `Person segmentation `__, `multiclass segmentation `__, `road segmentation `__.
- **Classification** 模型提供分类标签和对该标签的置信度。 示例: `EfficientNet `__, `Tensorflow classification `__, `fire classification `__, `emotions classification `__.
- **Recognition** 模型提供可用于识别或识别特征本身的字节数组。 示例: `Face recognition `__, `person identification `__, `OCR `__, `license plate recognition `__.
还有许多其他 AI 视觉任务不属于上述任何类别, 例如 `crowd counting `__,
`monocular depth estimation `__, `gaze estimation `__, 或
`age/gender estimation `__.
**上面的所有演示都在彩色/灰度帧上运行**。 其中许多视觉任务可以与深度感知(在OAK相机本身上) **融合** , **从而释放** :ref:`Spatial AI ` 的力量。
.. include:: /pages/includes/footer-short.rst