-
AI产品的发展方向 - 从聊天机器人到文本转换器AI产品的发展方向 - 从聊天机器人到文本转换器 ! 很认同同意Nick Dobos这个看法,目前这个阶段的 AI 产品方向已经不是聊天...
-
Mobius Labs - 关于1bit量化LLM的探索Mobius Labs - 关于1bit量化LLM的探索 ! Mobius Labs对1bit量化LLM进行了探索,探讨了使用HQQ+对预训...
-
大语言模型质量评估大语言模型质量评估 ! ✲ 大语言模型产品的评估系统 评估系统对大语言模型(LLM)产品的成...
-
三种类型的专家混合模型 (Mixture of Experts, MoE) 简介三种类型的专家混合模型 (Mixture of Experts, MoE) 简介 ! MoE 概述 MoE 使用稀疏的 MoE 层替换前馈...
-
TextCraftor - 创新的文本编码器微调技术TextCraftor - 创新的文本编码器微调技术 ! TextCraftor是一种创新的文本编码器微调技术,能够...
-
AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型AI21 Lab 新推出的 Mamba 架构和基于该架构的 Jamba 模型 ! AI21 Lab 推出了一种新的 LLM 架构 Mamba...
-
X AI Grok-1.5 更新X AI Grok-1.5 更新 ! X AI 发布了Grok-1.5更新,具有更好的推理能力及 128K 的上下文长度。昨天马...
-
Databricks 新开源模型 DBRXDatabricks 新开源模型 DBRX ! Databricks 最近发布了新的强大开源模型 DBRX。该模型架构如下: -...
-
LLM竞技场评分LLM竞技场评分 ! LLM竞技场 ELO 机制评分下,Claude-3 Opus 正式超过了 GPT-4 的最新版本,成为最...
-
小米发布SDXS项目 - 提速SD图像生成小米发布SDXS项目 - 提速SD图像生成 ! 小米也发布了一个大幅增强SD 图片生成速度的项目SDXS...
-
Claude Journalist - 一款强大的自动生成文章工具Claude Journalist - 一款强大的自动生成文章工具 ! Claude Journalist 是一个非常不错的工具,只要...
-
StreamingT2V - 高效生成长视频项目StreamingT2V - 高效生成长视频项目 ! StreamingT2V一个可以生成超过 2 分钟长视频(1200 帧)的项...
-
软件开发未来的思考 - Shesh软件开发未来的思考 - Shesh ! 软件开发者 Shesh 对软件开发未来的思考有点意思,描述了为什...
-
月之暗面开放了 KimiChat 200 万字上下文的内测申请,感兴趣可以申请试试月之暗面开放了 KimiChat 200 万字上下文的内测申请,感兴趣可以申请试试 ! 月之暗面开放了...
-
Grok-1 - 马斯克开源的314B规模模型Grok-1 - 开源的314B规模模型 ! 马斯克在最后一刻如约开源了Grok,模型有314B大小,这是第一个...