全部标签

Chat模型

卡内基梅隆 && 清华 | Prompt2Model：利用大模型Prompt，实现专有NLP模型生成！

引言随着大型语言模型 (LLM) 的应用，只需使用自然语言描述任务并提供一些示例，人们就能够方便的通过Prompt创建NLP系统。然而，相比传统的专用NLP模型，大型语言模型仍然存在计算资源紧张等问题。为此，本文提出了Prompt2Model平台架构，采用自然语言描述任务，并用它来「训练有利于部署的专用模型」。实验结果显示：Prompt2Model训练的模型的「性能比ChatGPT的结果…
Chat模型
- 2.5k
- 0
momo23年9月4日
浙大发布TableGPT，AI自动增删改查表格，实现自动分析数据、作图和建模

TableGPT: Towards Unifying Tables, Nature Language and Commands into One GPT 3 个月前，北大团队推出了 ChatExcel，让用户可以通过自然语言对话来操作 Excel 的各种功能，让人眼前一亮。但 ChatExcel 作为为了解决特定的问题而生的工具，其能力有限。浙大团队近日推出的 TableGPT，是…
Chat模型
- 10.3k
- 0
momo23年9月4日
质量>数量！数据对大型语言模型（LLM）整个生命周期的影响！

引言自去年底ChatGPT发布以来，大型语言模型(LLM)的性能极大的吸引了人们的注意力。在此过程中，我们逐渐的开始思考当前LLM发展过程。相比传统的自然语言模型，LLMs为什么能做到如此令人印象深刻的效果？针对该问题，尽管人们争论不断，但一项特别有影响力的进步是执行对齐的能力，这是毋庸置疑的。通俗来说，不管是通过指令信息还是检索信息，「人类已经明白如何训练LLM，使其不仅能够准确预测出下一个…
Chat模型
- 3.3k
- 0
momo23年9月4日
大型自然语言模型（LLM）最新学术进展！2023年7月份，爆款论文总结！

引言时间转瞬即逝，一个月又过去了。今天是7月的最后一天，让我们来盘一盘大型自然语言模型的发展状况。「目前总体情况看下来，其中主要涉及新的模型（LLaMA2、百聆）、Transformer研究（RetNet、LongNET、Transformer参数分析）、大模型安全推理（PUMA）、知识图谱（DiFaR）等」。所有论文下载可回复：2307论文总结 Google揭秘上下文学习加州伯克利&am…
Chat模型
- 8k
- 0
momo23年8月22日
中科院计算所 | 推出多语言大模型：BayLing(百聆)，性能媲美GPT-3.5，可在线体验！

如何用经济友好、内存节约的方式，来实现 LLM 生成能力和指令遵循能力的跨语言迁移？ 2023 年过半，ChatGPT、GPT-4、LLaMA 等大型语言模型（LLM）一次次引起人们高度关注，它们具备令人惊艳的涌现能力，包括语言理解能力、生成能力、知识推理能力等等。 LLM 通常基于大规模语料训练知识表示与语言生成能力，随后在人工编写的指令数据上进行微调以实现与人类的意图对齐。因此，如何有效地进行…
Chat模型
- 6.9k
- 0
午夜咖啡23年7月25日
部署教程：清华第二代60亿参数ChatGLM2！碾压GPT-4，推理提速42%

清华ChatGLM2-6B模型又开始刷圈了！新版本在推理能力上提升了42%，最高支持32k上下文。 ChatGLM-6B自3月发布以来，在AI社区爆火，GitHub上已斩获29.8k星。如今，第二代ChatGLM来了！清华KEG和数据挖掘小组（THUDM）发布了中英双语对话模型ChatGLM2-6B。最新版本ChatGLM2-6B增加了许多特性： - 基座模型升级，性能更强大- 支持8K-3…
ChatGPT
- 7.9k
- 0
可爱的熊猫23年7月11日
SOTA 开源中文多模态大模型来了！清华VisCPM部署教程

在 AIGC 行业迎来爆发性增长的这半年，国内的各个互联网科技企业也都在悄然发力。在此当中，一系列为中文互联网用户而生的 CPM 开源大模型，更是多次登上 GitHub 热榜。 2020 年 12 月发布的 CPM-1 是国内首个中文大模型；2022 年 9 月发布的 CPM-Ant 仅微调 0.06% 参数就能超越全参数微调效果；2023 年 5 月发布的 WebCPM 是中文首个基于搜索的问…
Chat模型
- 4.8k
- 0
午夜咖啡23年7月3日
开源大模型突破8K上下文，可商用：XGen-7b

大语言模型中，向来都只有ChatGPT以及其他。而由前 OpenAI副总裁离职创建的Claude，借着100k上下文成功出圈了，在无需微调的情况下，可以喂进整本书直接进行提问。这说明了长上下文，是大模型一个有效的突破点。 Salesforce就在昨天，一口气开源了三个模型，分别是：XGen-7b 8k base, XGen-7b 7k inst, XGen-7b 4k base。这三个模型采用了…
Chat模型
- 4.8k
- 0
午夜咖啡23年7月1日
让你也能拥有自己的ChatGPT：云服务器部署开源ChatGLM-6B

最近ChatGPT不仅发布了GPT-4，而且解除封印可以联网了。不得不赞叹AI更新迭代的速度真快，都跟不上节奏了。但是大家也注意到了吧，随着ChatGPT的每次更新，OpenAI对其开放使用的限制也越来越大。之前国内网随便访问GPT3，现在动不动就封号了所以，今天就来教大家部署国内清华大学开源的ChatGLM-6B。简单介绍下，ChatGLM是对话语言模型，对中文问答和对话进行了优化。当前训练模…
Chat模型
- 17.8k
- 0
Hello23年4月22日
清华ChatGLM-6B模型本地部署十分钟部署效果杠杠的

清华公布了中英双语对话模型 ChatGLM-6B，具有60亿的参数，初具问答和对话功能。最！最！最重要的是它能够支持私有化部署，大部分实验室的服务器基本上都能跑起来。因为条件特殊，实验室网络不通，那么如何进行离线部署呢？
ChatGPT
- 41k
- 0
Hello23年4月13日