1-Basic

2-Sam

  1. 原始的 segment anything 方案: https://github.com/facebookresearch/segment-anything
  2. 手机侧直接做的代码: https://github.com/ChaoningZhang/MobileSAM
  3. 进化版的代码, FastSAM: https://github.com/CASIA-IVA-Lab/FastSAM
  4. 最近技术的代码, EfficientSAM: https://github.com/yformer/EfficientSAM

几种方案的对比: https://artgor.medium.com/paper-review-efficientsam-leveraged-masked-image-pretraining-for-efficient-segment-anything-0043ca74abea

历史所有 sam 方案的汇总: https://github.com/Hedlen/awesome-segment-anything

3-Stable Diffusion

搜索

  • ElasticSearch ltr: 一个 Es 的插件,配合机器学习模型 实现 更好的 Rank

  • 同时考虑了 文本和 Vector 的更先进的引擎, 一键式 AI 搜索

  • 网易BCE: 支持多语种的 搜索 rerank 和 embedding 适合作为上游任务

5-LLM

News

  • AnyText : …
  • MyShell-OpenVoice: 厉害厉害. Clone any voice in an instant, take control of its style, across any language.
  • pika : 生成视频目前最好的
  • midreal : 生成小说, 目前爆火
  • DomoAI: 图片到 视频
  • ColossalAI: Making Large AI models cheaper, faster and more accessible
  • Fooocus: 做的越来越好了