新闻资讯

等优化 RouterLLM HybridLLM LLM 混合模型 推理成本的新思路
等优化 RouterLLM HybridLLM LLM 混合模型 推理成本的新思路

一、背景本文中我们继续介绍一种LLM推理优化相关的工作,通过路由的方式组合多个模型;其与投机采样类似,通过多个不同规模和性能的模型组合来降本增效,然而又有本质的...

+查看全文

14 2024-11

六款超火的AI绘图软件推荐!总有一款AI适合你!
六款超火的AI绘图软件推荐!总有一款AI适合你!

AI绘图软件有推荐吗,随着AI绘图技术的不断发展,AI绘图软件的出现不仅改变了我们传统绘图的方式,而且还为我们的图片创作提供更多的可能性,在艺术作品的创作上轻松...

+查看全文

14 2024-11

两种高效的Rerank模型实践指南 再次提升RAG性能
两种高效的Rerank模型实践指南 再次提升RAG性能

在高级RAG应用中,检索后处理环节至关重要,Rerank技术通过重新排序检索出的文档块,确保与用户问题更相关的信息排在前面,从而提高语言模型生成答案的质量,在这...

+查看全文

14 2024-11

一款可以智能做数据分析的工具! Pandas AI
一款可以智能做数据分析的工具! Pandas AI

01.概述PandasAI是一个开源项目,旨在为Pandas库添加AI功能,它允许用户通过自然语言查询来轻松地与数据进行交互,这个库利用生成式人工智能技术,使用...

+查看全文

14 2024-11

KVSharer 基于不相似性实现跨层 Cache KV 共享
KVSharer 基于不相似性实现跨层 Cache KV 共享

一、背景本文中我们介绍一种最新的KVCache共享论文KVSharer,与之前常见的层内共享不同,KVSharer主要关注跨层共享,并且是整个层的共享,对应的论...

+查看全文

14 2024-11