开源项目精选（若github打不开，请多试几次） - AINav.net

开源项目精选（若github打不开，请多试几次）

YOLO

目标检测，物体识别

开源项目精选（若github打不开，请多试几次）

AutoCaption

AutoCaption

给视频加字幕

开源项目精选（若github打不开，请多试几次）

通义千问

通义千问

阿里大模型开源

开源项目精选（若github打不开，请多试几次）

photo-maker

photo-maker

人物图生成。利用多张照片作为身份ID，获取人物特征，然后根据描述生成一个新的、个性化的人物图像。

开源项目精选（若github打不开，请多试几次）

OpenVoice

语音克隆

开源项目精选（若github打不开，请多试几次）

MaterialSearch

MaterialSearch

文搜图，视频

开源项目精选（若github打不开，请多试几次）

labelU

标注工具

开源项目精选（若github打不开，请多试几次）

HivisionIDPhotos

HivisionIDPhotos

证件照生成

开源项目精选（若github打不开，请多试几次）

echomimic_v2

echomimic_v2

视频生成

开源项目精选（若github打不开，请多试几次）

deepseek开源

deepseek开源

deepseek开源

开源项目精选（若github打不开，请多试几次）

目标检测。YOLOv6的精度与速度都远超 YOLOv5 和 YOLOX。

开源项目精选（若github打不开，请多试几次）

使相片变高清

视觉项目

生成人脸，编辑人脸。

视觉项目

EmotionClassifier

表情识别。识别开心，悲伤，惊讶等等表情

视觉项目

alphafold_casp13

预测蛋白质形状。AlphaFold 是 DeepMind 开源的人工智能系统，借助 AlphaFold 可以更加准确的预测蛋白质的形状。主要应用于医疗保健和生命科学领域，有可能加速药物的研究与发现。

医疗项目

人脸属性替换。例如换个鼻子嘴巴，甚至肤色和性别，通过StarGAN v2可是轻松的识别人脸属性，并精准替换，肉眼都难以发现破绽。

视觉项目

去除人脸马赛克。眼中有码，心中无码”是境界，“图上有码，脑补解码”就是PULSE算法了。 PULSE 算法目前只支持人脸的马赛克“去除”，因为训练数据都是人脸。

视觉项目

FALdetector

反美颜系统。美颜就是通过“曲面液化”来达到形状调整的目的的，只要经过液化的照片，电脑都能找到痕迹，并将其还原。

视觉项目

从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品；Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。

视觉项目

BackgroundMattingV2

高清实时抠像（无绿布）

视觉项目视频项目

deep-image-prior

图像去水印及修复。去除一张照片的水印，将一张缺损内容的照片修复，将一张模糊的照片，变得清晰

视觉项目视频项目

AdaIN-style

照片风格化。换成油画，卡通等等风格

视觉项目

人工智能换脸。

AI换脸项目视觉项目

移除视频人物。可以移除视频中的物体。

视觉项目视频项目

年龄编辑项目。高分辨率的人脸年龄编辑。人脸年龄编辑则不仅可以做人脸老化，还能“返老还童”。

年龄编辑项目视觉项目

物体检测项目。输入一张图片，输出其中有哪些的物体对象，以及每个对象的位置。其最大的特点是运行速度很快，可以用于实时系统。

目标检测项目视觉项目

腾讯人脸识别开源项目。TFace项目中的算法能力已应用在内外多个业务中，对内广泛支撑了腾讯内部如微信，QQ中的身份识别需求，对外则通过腾讯云服务的形式，提供了ToC、ToB的相关能力，典型应用案例如跨年龄寻人、人脸核身、刷脸支付等。

人脸识别项目视觉项目

拍照做题。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

视觉项目

推荐系统项目。

推荐系统项目

让视频换成你想说的话。他的功能，就是上传一段视频，再上传一段音频，算法会让视频中的人物说出音频文件的内容。通过机器学习让发音与嘴型进行匹配。

视觉项目

1 2