LLM的相关内容 - 漫话开发者

2024-06-25 talkingdev

ParaLLM ：Mac上基于MLX实现每秒1300个Token推理

在MLX中实施批量并行KV缓存，导致合成数据生成和模型完成的推理时间显著提速。这种新的技术实现方式大大加快了处理速度，从而在Mac上每秒可以处理1300个Token。这一突破性的技术进步，不仅可以提高处理效率，同时也...

2024-06-24 talkingdev

Andrej Karpathy发布了一个新的仓库，这是他正在进行的一个新课程的大纲。课程涉及构建一个可以讲述故事的对齐语言模型。课程包括视频讲座、代码和其他学习材料。这是一个主要围绕人工智能和机器学习的课程，强调对...

2024-06-23 talkingdev

Llama.ttf是一种新型字体技术，它不仅可以作为字体使用，还能充当LLM（低级语言模型）的一部分。该技术通过将LLM嵌入字体中，使得字体在呈现文本的同时，也能进行机器学习任务。这项技术的研究者表示，Llama.ttf可以...

2024-06-21 talkingdev

自我托管像Llama-3 8B-Instruct这样的LLM，其成本可能远高于使用ChatGPT，大约每百万令牌需要花费17美元，而ChatGPT只需要1美元。不过，自我托管硬件的成本可以降低到每百万令牌不到0.01美元，尽管这需要大约5.5年的...

2024-06-20 talkingdev

近日，知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs（Large Language Models）的Agent精度测量。该技术旨在提升大型语言模型的代理精度，助力开发者更加准确地评估和优化模型性能。据了解，LLMs...

2024-06-20 talkingdev

近日，一个名为Dot（GitHub Repo）的开源应用引起了大家的关注。这是一个独立的开源应用，其主要目的是让用户更轻松地使用本地LLMs（语言模型）和RAG（重新生成的注意力引导）来与文档和文件进行交互。这种交互方式...

2024-06-20 talkingdev

决策QA是LLMs的一项新任务，它能够基于复杂的数据分析来确定最佳的决策。在传统的决策制定过程中，我们需要人工对大量数据进行分析，这不仅耗时耗力，而且可能由于人为因素导致决策的偏差。而现在，LLMs的出现，让决...

2024-06-06 talkingdev

研究人员推出了LlamaCare，一个专门为医疗知识调优的大型语言模型（LLM）。LlamaCare不仅在处理医疗数据方面表现出色，还引入了扩展分类集成（ECI）技术，以解决LLM中的分类问题。该模型的推出标志着医疗领域人工智...