Tag: AI

All the articles with the tag "AI".

罗切斯特大学与微软联合推出的图像修复工具 PromptFix
Published:2024-11-02
罗切斯特大学与微软合作推出了一款强大的图像修复工具 PromptFix，用户可通过文字描述有效修改图像。该工具在修复图像自然度和细节方面表现出色，支持图像上色、亮度提升、去除水印、物体移除、除雪、去雾和去模糊等多种任务。它能在保持原始结构的同时修复图像缺陷，并支持不同宽高比的图像处理，快速完成 20 步修图，功能强大实用。
PromptFix：让我们修复你的照片的智能提示工具
Published:2024-11-02
PromptFix 是一个开源项目，由 yeates 开发，旨在通过智能提示修复照片。该工具在 NeurIPS 24 上发布，提供了独特的能力，结合先进的 AI 技术，可以针对用户给出的照片提示进行优化和修复，提升照片的质量与表现。
Docling：IBM 的智能文档解析转换框架，支持多格式文档解析
Published:2024-11-02
Docling 是 IBM 推出的智能文档解析转换框架，具备多格式文档解析能力，支持 PDF、DOCX、PPTX、图片、HTML、AsciiDoc 和 Markdown 等格式，可输出为 Markdown 和 JSON。它拥有高级 PDF 处理能力，能够理解页面布局、识别阅读顺序并处理表格结构，极大提升文档理解效率。
发现了一个令人惊奇的 LoRA 模型：生成匹配过去与现在图像的艺术作品
Published:2024-11-02
在 Twitter 上，Ring Hyacinth 分享了一个特别棒的 LoRA 模型，能够生成与过去和现在的照片相匹配的图像。这个项目的非功利性质与丰富的想象空间令我印象深刻，展现了 AI 潜力的无限可能性。了解更多信息请查看链接。
D-FINE：将 DETRs 的回归任务重新定义为细粒度分布细化
Published:2024-11-02
D-FINE 是一个项目，旨在将 DETRs 的回归任务重新定义为细粒度分布细化。该项目为计算机视觉和深度学习领域提供了新的视角，通过优化回归任务，提升了模型的表现。项目链接：
浙大与字节联合开源的 MimicTalk：快速生成个性化的 3D 说话头像
Published:2024-11-02
浙大与字节联合开源了 MimicTalk 项目，旨在快速生成个性化的 3D 说话头像视频。该项目利用基于 NeRF 的通用模型，提高了个性化 TFG 的效率和鲁棒性，无需为每个身份单独训练模型，大幅提升训练速度，仅需几分钟即可创建能够模仿用户说话风格和表情的虚拟头像。
Recraft V3：颠覆性 AI 模型在设计语言中的应用
Published:2024-11-01
Recraft V3 是一款颠覆性的 AI 模型，它能够以设计语言进行思考，提供前所未有的文本生成质量，超越 Midjourney、OpenAI 等模型。不仅仅是图像生成工具，它还是一款强大的文本处理工具，具备更高效的设计表达能力。
微软开源数据可视化 AI 工具：Data-Formulator
Published:2024-11-01
微软推出了数据可视化 AI 工具项目：Data-Formulator，支持用户界面交互与自然语言输入结合，能够进行数据转换并创建可视化效果。该工具可处理图片和混乱文本，适合专业分析师和普通用户使用，重点特点包括拖拽操作与自然语言输入，无需编码技能。

Tag: AI

罗切斯特大学与微软联合推出的图像修复工具 PromptFix

PromptFix：让我们修复你的照片的智能提示工具

Docling：IBM 的智能文档解析转换框架，支持多格式文档解析

发现了一个令人惊奇的 LoRA 模型：生成匹配过去与现在图像的艺术作品

D-FINE：将 DETRs 的回归任务重新定义为细粒度分布细化

浙大与字节联合开源的 MimicTalk：快速生成个性化的 3D 说话头像

Recraft V3：颠覆性 AI 模型在设计语言中的应用

微软开源数据可视化 AI 工具：Data-Formulator