Skip to content

推理框架

  • Tengine
  • Paddle
  • NCNN
  • CoreML
  • TNN
  • MNN
  • ONNXRuntime
  • DNN
  • TFLite
  • TensorRT
  • OpenVINO

推理发展方向

  • 基础
    • 神经网络原理与应用
    • 神经网络算子
    • 编写高性能神经网络算子
  • Web 方向
    • 使用 Go / Spring 等先进的 Web 架构
    • 使用 gRPC 进行通信和代理
    • 封装服务并完成业务逻辑
  • 运维方向
    • 使用 Nginx 和负载均衡实例
    • 使用更低廉的弹性部署方案
    • 服务器监控和管理
  • CI/CD
    • 使用 Kubernetes / Docker 进行部署
    • 持续集成和优雅降级
  • 推理方向
    • 使用个性化适配的高性能显卡推理
    • 使用 RPC 封装服务进行相互操作
    • 有层级地部署推理服务

优化方向:

  • 计算图优化
  • 算子优化
  • Vulkan 优化方向

Vulkan 方向

  • 计算机图形学
  • GLSL
  • GLSL 计算着色器

推理服务程序

  • OpenMMLab
  • MegEngine
  • TF-Serving
  • Triton
  • TorchServe
  • BentoML
  • Seldon Core
  • KF-serving

计算库

  • OpenBLAS
  • NumPy
  • OpenCV