服务展示

多尺寸编辑质量更优 首个基于DiT的图像编辑框架!DiT4Edit 抛弃UNet
多尺寸编辑质量更优 首个基于DiT的图像编辑框架!DiT4Edit 抛弃UNet

文章链接,https,arxiv.org,pdf,2411.03286工程链接,https,github.com,fkyyyy,DiT4Edit,待开源,亮点直...

+查看全文

15 2024-11

旷视等开源Chat 谷歌&amp 编辑能力无上限!北航&amp
旷视等开源Chat 谷歌&amp 编辑能力无上限!北航&amp

文章链接,https,arxiv.org,abs,2407.06842项目地址,https,sk,fun.fun,CE3D,代码,https,github.co...

+查看全文

15 2024-11

Web2Code 适用于多模态大模型的大规模网页转代码数据集与评估框架
Web2Code 适用于多模态大模型的大规模网页转代码数据集与评估框架

一、结论写在前面论文标题,Web2Code,ALarge,scaleWebpage,to,Code>,论文链接,​​https,arxiv.org,pdf,...

+查看全文

15 2024-11

Golden Agentic RAG
Golden Agentic RAG

企业落地RAG系统痛点,Golden,Retriever系统,在文档检索前增加了一个基于反思的问题增强步骤,用于识别术语、根据上下文澄清其含义,并相应地增强问题...

+查看全文

15 2024-11

文本直接生成多视角3D图像 Meta推出创新模型
文本直接生成多视角3D图像 Meta推出创新模型

随着扩散模型的不断创新,文生图领域出现了Midjourney、StableDiffusion、DALL,E3等一系列知名产品,但在文本生成多视角3D图像方面一直...

+查看全文

15 2024-11