从Transformer到GPT-4 📁机器学习📆2024-01-15 🤯PH 👀2,144 次浏览 近期Multi-model看的比较多,受Mu Li启发制作了一张技术路线图,挂网分享。 💡 相关链接:CV • NLP • 多模态 本文采用知识共享署名-非商业性使用-相同方式共享4.0 国际许可协议进行许可。 上一篇 Prompt(第二个p不发音) 下一篇 GDC 2024
大模型学习路线 整理了一下大模型与多模态大模型的技术路线,包括基础课程、经典教材、开源项目等。 1.什么是大模型 大模型全称是大型语言模型(Large Language Model, LLM),指具有超大规模参数量(通常超过十亿个)的深度神经网络模型。 大模型是自然语言处理(NLP)领域的重要技术分支,从技术角度来看,大模型特指近年来以Transformer架构(谷歌2017年首次提出)为核心的超大规模神经网络模… 📁 机器学习 资料库 📆 2025-06-06