AIbase基地于2026年1月4日报道,知名人工智能实验室DeepSeek发布了一项极具影响力的研究论文,揭示了大型语言模型(Large Language Models, LLM)的推理性能可以通过优化神经网络架构来显著提升,而并非单纯依赖增加模型规模。这一发现为人工智能行业提供了一条在不依赖“无限参数堆叠”的情况下变得更强大的新路径。
在经历了2023年和2024年两年的巨大炒作之后,2025年对于基于大型语言模型(Large Language Model, LLM)的token预测行业来说,更像是一个稳定期。在公众对人工智能模型作为未来人类文明威胁或未来神灵幼苗的担忧持续两年多之后,炒作似乎正在让位于实用主义:今天的人工智能可能非常有用,但它也明显不完美,容易出错。
The added value of core industries of China's digital economy, culture and tourism sectors accounted for increased shares of ...
"Supported by a growing ecosystem of open-source models, large model technology, just like water and electricity and the Internet, is increasingly becoming a convenient and widely accessible basic ...
大语言模型(Large Language Model,以下简称「大模型」),顾名思义,是人工智能(AI)依赖大量的语言素材进行分析,再整合出来的计算模型。目前全球最先进的大模型,例如ChatGPT或DeepSeek,已经可以像人一样生成自然语言,并和我们进行日常交谈,给予我们意见,甚至是情绪支持。但这是否代表这些大模型已如同人一样,拥有认知能力与社会价值观?科学界对此仍存有争议。 首先,大模型本身 ...
十轮网科技资讯 on MSN
NVIDIA RTX PRO 5000 72GB Blackwell登场! 内存狂增50%,AI运算更给力
NVIDIA发布采用PCIe界面的RTX PRO 5000 72GB Blackwell运算卡,提供更大容量的显示内存,并可升级现有台式机或工作站。 随着大型语言模型(Large Language Model,LLM)的参数量日益庞大,以及代理式AI(Agentic ...
近日,科大讯飞(002230)研究院与认知智能全国重点实验室联合研究团队在Nature 旗下国际重要期刊《通讯-化学》(Communications Chemistry)发表题为《Evaluating Large Language Models on ...
本项目的目标是促进中文对话大模型开源社区的发展,愿景是成为能够帮到每一个人的LLM Engine。 相比如何做好大语言模型的预训练,BELLE更关注如何在开源预训练大语言模型的基础上,帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力 ...
我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...
4月27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容。 Vidu, a text-to ...
编者按:大型语言模型(Large language models, LLMs)因其在学术界和工业界展现出前所未有的性能而备受青睐。随着 LLMs 在研究和实际应用中被广泛使用,对其进行有效评测变得愈发重要。近期已有多篇论文围绕大模型的评测进行研究,但尚未有文章对评测的方法 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果