数据赋能实验室部分师生参加大模型培训

更新时间：2024-12-16 11:37:14 编辑：管理员访问量：1931

2024年7月26---29日，赵峰教授组织实验室部分师生参与为期三天的西电杭研院的大模型培训。伴随人工智能技术的加速发展，AI大模型已成为全球科技竞争的新高地。AI大模型的研究与建设已经上升为国家战略，是未来产业的新赛道、经济发展的新引擎，因此掌握大模型的基础框架以及应用场景迫在眉睫。

本次培训向我们介绍了三类场景下的AI大模型的应用，分别为语言类AI大模型、图像类AI大模型和办公类AI大模型。

其中语言类AI大模型是一种包含数百亿及以上参数的深度神经网络构建的语言模型，是一种生成式AI，它基于文本进行训练并生成文本内容。大语言模型在国内外都有大量应用，例如国外的Chat GPT-4模型、国内的文心一言、kimi等模型。这些模型在处理语言及结构化数据方面展示了卓越的能力，广泛应用于科研、医疗、商业等多个领域。

图像类AI大模型是指用于处理和分析图像数据的人工智能模型。其又包括文生图大模型和图生图大模型两类。文生图大模型主要利用Stable Diffusion系统框架，框架包括文本编码器（text encoder）、图像信息生成器（image information creator）和图像解码器（image decoder）三部分，主要功能是利用参与者所提供的文本语言描述来进行图像生成。图生图大模型主要利用生成对抗网络（GAN），框架包括生成器（Generator）和判别器（Discriminator），通过对抗训练相互竞争，最终使生成器能够产生几乎无法与真实图像区别的图像，主要功能是利用参与者所提供的图像来进行相似图形生成。国外图像类大模型有Midjourney、DALL-E等，国内有文心一格、通义万相等。培训中展示了图像大模型在视觉艺术和实际工业应用中的实际能力。

办公场景下的大模型主要功能是使参与者在使用Excel、Word等常用办公工具时能更便捷，提供了一些常用的编辑功能。办公场景下的大模型有Microsoft 365、WPS AI、ChatExcel等，培训中展示了大模型如何在企业环境中通过自动化复杂的文档管理任务来提升工作效率。

通过此次培训，我们受益匪浅，不仅了解到了常用的几类大模型，还学会了怎么使用这些大模型，怎么利用大模型来帮助我们解决在日常科研上所遇到的问题，对大模型的理解和应用能力得到了显著提升。展望未来，随着技术的不断进步和数据量的增长，大模型的潜力将进一步释放，其应用领域也将不断拓展。期待大模型技术在提高业务效率、推动科学研究以及促进社会发展方面发挥更大作用。此次培训是一个起点，我们将持续关注大模型技术的最新进展，探索其在各行各业中的创新应用，共同迈向一个智能化的未来。

以下是常用的开源的大模型链接：

https://openai.com/

https://yiyan.baidu.com/

https://kimi.moonshot.cn/

https://www.liblib.art/

数智赋能实验室部分师生参加大模型培训