目标检测,物体识别
给视频加字幕
阿里大模型开源
人物图生成。利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
语音克隆
文搜图,视频
标注工具
证件照生成
视频生成
deepseek开源
目标检测。YOLOv6的精度与速度都远超 YOLOv5 和 YOLOX。
使相片变高清
生成人脸,编辑人脸。
表情识别。识别开心,悲伤,惊讶等等表情
预测蛋白质形状。AlphaFold 是 DeepMind 开源的人工智能系统,借助 AlphaFold 可以更加准确的预测蛋白质的形状。主要应用于医疗保健和生命科学领域,有可能加速药物的研究与发现。
人脸属性替换。例如换个鼻子嘴巴,甚至肤色和性别,通过StarGAN v2可是轻松的识别人脸属性, 并精准替换,肉眼都难以发现破绽。
去除人脸马赛克。眼中有码,心中无码”是境界,“图上有码,脑补解码”就是PULSE算法了。 PULSE 算法目前只支持人脸的马赛克“去除”,因为训练数据都是人脸。
反美颜系统。美颜就是通过“曲面液化”来达到形状调整的目的的, 只要经过液化的照片,电脑都能找到痕迹,并将其还原。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
高清实时抠像(无绿布)
图像去水印及修复。去除一张照片的水印,将一张缺损内容的照片修复,将一张模糊的照片,变得清晰
照片风格化。换成油画,卡通等等风格
人工智能换脸。
移除视频人物。可以移除视频中的物体。
年龄编辑项目。高分辨率的人脸年龄编辑。人脸年龄编辑则不仅可以做人脸老化,还能“返老还童”。
物体检测项目。 输入一张图片,输出其中有哪些的物体对象,以及每个对象的位置。其最大的特点是运行速度很快,可以用于实时系统。
腾讯人脸识别开源项目。TFace项目中的算法能力已应用在内外多个业务中,对内广泛支撑了腾讯内部如微信,QQ中的身份识别需求,对外则通过腾讯云服务的形式,提供了ToC、ToB的相关能力,典型应用案例如跨年龄寻人、人脸核身、刷脸支付等。
拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。
推荐系统项目。
让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。