• “从边缘系统到核心交易,从架构重塑到自主创新。”该券商技术负责人感慨道,这场历时四年的信创转型,本质是一次从 “IT支撑”到“科技驱动”的金融生产力革命。
    8.0.95新架构的自定义路由优先级解决策略路由不生效问题
    本期焦点1、AI的起源-The Imitation Game2、自然语言-NLP、NLU、NLG3、机器学习方法-无监督、监督、强化4、神经网络简介-起源、训练&推理 随着人工智能技术的快速发展,企业在AI落地方面的探索愈发重要。为适应客户与市场需要,近期将通过《AI三部曲》讲清楚AI的由来、大模型的工作机制、常见大模型与AICP产品的实操帮助大家构建AI知识体系与AI实操能力!知识框架如下 同时也会穿插AICP及AIPAAS相关的知识,帮助各位应对测试和交付项目。 1、AI的起源-The Imitation Game 图灵测试,原称为模仿游戏(The Imitation Game),是艾伦·图灵在1950年在论文《计算机器与智能》中提出图灵思想测试。 设想一位测试者与两个被测试者(一个人和一台机器)通过文本方式交流,测试者若无法准确分辨人与机器,且对机器身份判断错误率达30%以上,机器便通过测试,被认为具备人类级智能。 由于当时对于什么是人工智能也没有一个公认的定义,图灵绕过中间的环节,不考虑这个机器具备这些或哪些的模块,仅考虑测试者的真实感受。这一思想实验为人工智能发展提供了重要的评估方向,推动自然语言处理等领域的研究。 2、自然语言-NLP、NLU、NLG 我们以前需要使用计算机的语言(二进制0101)与计算机进行交互,现在转变成我们直接使用人类的语言就可以与计算机进行交互。自然语言处理等领域的研究自然语言分为NLP(Natural Language Processing,自然语言处理)、NLU(Natural Language Understanding,自然语言理解)、NLG(Natural Language Generation,自然语言生成) 在实际应用中三种自然语言的相互协作:NLP处理用户输入的文本进行分词、句法分析,如“我今天晚上要去看《哪吒2》电影”; NLU理解用户的意图(比如“订电影票”)和提取关键信息(如时间、地点); NLG则是根据结构化数据生成恢复(比如“已为您预定了《哪吒2》的电影,时间是今晚7点半”)。 通俗类比● NLP:像一位“语言工程师”,负责拆解、组装语言的结构。● NLU:像一位“语言翻译官”,专注理解语言背后的含义。● NLG:像一位“作家”,根据数据或指令生成自然流畅的文本。 三者区别 维度NLPNLUNLG 核心功能处理和分析语言理解语言的含义和意图生成自然语言文本 输入/输出输入文本 → 结构化分析或任务处理输入文本 → 语义解析(意图、实体)结构化数据 → 自然语言文本 关键技术分词、句法分析、翻译语义分析、情感识别、上下文推理文本规划、句子生成、风格控制 典型应用搜索引擎、语音识别智能客服意图识别、情感分析自动写作、聊天机器人回复生成 3、机器学习方法-无监督、监督、强化 NLG则是根据结构化数据生成恢复(比如“已为您预定了《哪吒2》的电影,时间是今晚7点半”)。要了解机器学习(ML),首先还是需要有个粗略的AI体系分支 可以看到完成一个生成式的AI,现阶段需要具备机器学习方法、深度学习(CNN、RNN、Transformer)和LLM。当然要让AI最终好用,还需要进行训练(预训练、微调)和增强技术(RAG、提示词),本次不做讲解。 机器学习分为三种,监督学习、无监督学习和强化学习a.监督学习(Supervised Learning):本质来讲就是通过监督员帮助模型对数据集进行打标签,让模型能够具备相关能力 例如猫狗的识别,监督员提前针对猫猫狗狗的特征打好标签,输入给AI,最终让AI具备识别猫还是狗的能力 同时也具备回归(Regression)的能力,根据该地区或国家的房价,去这个地区或国家的平均房价 b.无监督学习(Unsupervised Learning):向机器输入原始数据(无标签),由机器学习算法自行寻找规则,让模型具备相关能力 例如输入一堆带颜色的形状,机器通过无监督学习自行基于形状或颜色进行聚类 c.强化学习(Reinforcement Learning):通过与环境的交互来学习最优策略,从而实现目标任务的最大化 学习方法有监督学习无监督学习强化学习 数据训练数据集每个样本都有一个标签或者输出训练数据集没有标签或输出不需要大量数据,但需要明确清楚角色、行动、奖励等(可量化) 学习方法思路学习输入和输出之间的映射关系,从而能够对新的输入数据进行预测或分类学习数据的内在结构和规律通过与环境的交互来学习最优策略,从而实现目标任务的最大化 应用场景通常用于分类、回归等问题,例如图像分类、语音识别、房价预测等通常用于聚类、降维等问题,例如图像分割、异常检测、推荐系统等通常用于决策问题,如机器人控制、自动驾驶、游戏AI。EX:Alpha Go 同时机器学习后,对结果的评估也会有以下三种 欠拟合:模型描述能力太弱,以至于不能很好地学习到数据中的规律。产生欠拟合的原因通常是模型过于简单。欠拟合是指模型不能在训练集上获得足够低的误差过拟合:是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测的很好,但对未知数据预测得很差的现象。这种情况下模型可能只是记住了训练集数据,而不是学习到了数据特征。也就是过拟合是指训练误差和测试误差之间的差距太大。 4、神经网络简介-起源、训练&推理 4.1神经网络起源起源:1981 年的诺贝尔医学奖,证明“可视皮层是分级的”经过:在猫的后脑头骨上,开了一个3 毫米的小洞,向洞里插入电极,测量神经元的活跃程度;然后,他们在小猫的眼前,展现各种形状、各种亮度的物体。并且,在展现每一件物体时,还改变物体放置的位置和角度。经历了很多天反复的枯燥的试验,同时牺牲了若干只可怜的小猫,David Hubel 和Torsten Wiesel 发现了一种被称为“方向选择性细胞(Orientation Selective Cell)”的神经元细胞。当瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种神经元细胞就会活跃。 从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象,直至给出对物体的判断(大脑进一步判定该物体是只气球)。 那生物神经元和AI的神经元是一样的吗?当然不是 一个生物神经网络是由一组化学上相连或功能上相关的神经元组成。一个神经元可能与许多其他神经元相连,网络中的神经元和连接的总数可能很广泛。连接,称为突触,通常是从轴突到树突形成的,尽管树突和其他连接是可能的。除了电信号外,还有其他形式的信号,这些信号来自于神经递质的扩散。 4.2神经网络结构与模型组成■ 典型神经网络结构模型如下机器学习(商品推荐、人脸识别) 深度学习(下围棋、自动驾驶) 10B大模型LLM(AI助手,数字人) ■ 神经网络模型的组成神经网络模型由特征、权重和激活函数组成。通过分析、设计特征工程,真实世界可以用有限个特征描述。而在神经网络中,每一层的参数就是特征,整个神经网络通过若干参数来描述真实世界。输入层、输出层、隐藏层的数量和每层参数所用函数,都可以通过特征工程来做相应设计。 所以在神经网络的真实数学表达中如图所示各层 每一个神经网元都是由两部分组成:一个求和、一个函数, 这个函数我们称为“激活函数”,通过它来为下一层的计算进行判断,来激活下一层,所以叫激活函数f 5、神经网络的推理和训练训练过程1.前向传播(Forward Propagation):输入到输出各层计算(如卷积、池化层等),产生输出并完成损失函数计算。2.反向传播(Back Propagation):由输出到输入反向完成整个模型中各层的权重和输出对损失函数的梯度求解。3.梯度更新(Weight Update):根据指定的指定学习率,对模型权重通过梯度下降算法完成权重的更新。推理过程推理(Inference)只需要执行训练过程中的前向传播过程当完成模型训练,意味着在给定的数据集上,模型已经达到最佳或者满足需求的预测效果。如果 AI 算法工程师对模型预测效果满意,就可以进入模型部署进行推理和使用模型。 由输入到输出完成整个模型中各个层的矩阵计算(如卷积、池化层等),产生输出。输入人脸图片,输出结果为4个向量 ,向量中的各个维度编码了图像的类别可能概率,其中第一个位置的编码向量类别概率最大,后续应再转换为可读信息训练和推理的区别训练:通过设计合适 AI 模型结构以及损失函数和优化算法,将数据集以 mini-batch (数据集分为多个批次,作用是每次使用少量数据更新模型参数,再用新的数据验证等刚得到模型参数的计算效果)反复进行前向计算并计算损失,反向计算梯度利用优化函数来更新模型,使得损失函数最小。训练过程最重要是梯度计算和反向传播。 推理:在训练好的模型结构和参数基础上,进行一次前向传播得到模型输出。相对于训练,推理不涉及梯度和损失优化。最终目标是将训练好的模型部署生产环境中。 ■ 下期预告 1. Transformer工作原理2. AICP安装部署详解和checklist3. 当前版本兼容性与边界
    【百万S豆 “找茬”计划】提效助力,售后问题快人一步!排障助手助你高效解决各种问题
    活动背景:6月26日15:00,深信服将携手国际备份厂商巨头Veritas带来“VMware替代硬核攻略之无代理备份专场”直播活动,欢迎大家围观!同时,大家可以按照指引扫码领自己的专属邀约码邀请他人进行观看,top10均可获得腾讯视频年卡会员!更多详细信息:https://mp.weixin.qq.com/s/mfVUcYEBFl_xAfbd5w_YNg 具体奖励规则>>>>>>>回帖有奖!!!1、【一人一码】按照下方海报指引,生成自己的专属二维码,将二维码贴在本帖评论区,将获得100s豆!2、利用自己的专属二维码,邀约对直播话题感兴趣的观众报名、观看,每成功邀约1名,贡献值+1、邀约人数top10将获得【腾讯视频SVIP年卡】注:实际观看/邀约占比少于30%时将取消入选获奖资格3、活动时间为:6月25日-6月26日14:50(短平快冲榜!)4、获奖名单+领奖方式见教程海报 冲榜教程请参考下面的海报:
    办公安全建设从「碎片化」向「一体化」转型,来看某全球新能源500强企业怎么做
    【实时更新】精华文章专区

    覆盖全产品线,汇聚2000+精华、优秀文章,助您更好了解和使用深信服产品!

    【在线课堂充电站】

    改了20000多份卷子,梳理出的高频易错点,都在这里。

    【社区新周刊】每周一更新,让大家迅速GET新知识

    社区特别推出【社区新周刊】固定栏目,选出过去一周社区最新鲜的干货内容,每周更奉送给大家,欢迎点击关注!

    本专区主要为云产品服务订阅调研问卷汇总帖
    报告新鲜出炉,深信服超融合再次勇夺第一! 国际数据公司(IDC)最新发布的《中国软件定义存储(SDS)及超融合存储(HCI)系统市场季度跟踪报告,2024Q4》显示,深信服超融合以20.2%的第四季度市占率强势登顶,更以全年17.5%的市场份额,蝉联中国超融合市场第一!
    精选最新、最热、版主推荐内容,助您快速高效获取产品装备材料!
    产品装备
    一朵云面向AI进行全新升级,为用户打造更匹配大模型场景的智算承载、应用构建的AI平台,面向用户基于DeepSeek承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案!
    《数字化深视野》是深信服面向客户及合作伙伴专门制作的期刊。 内含IT行业的前沿动态、深度专题解读、技术痛点、实践案例等等,旨在更好的与您共同探索数字化转型之路。
    区域精选|各区域Q3高阅读量技术文章汇总
    没有更多了

    哎哟,没有更多内容啦!
    赶紧去多找几个大神关注吧!关注后将在此处优先展示你关注的人发表的最新内容哦!

    哎哟,你还没有关注任何人!
    关注后将在此处优先展示你关注的人发表的最新内容哦!赶紧去找大神吧!

专业 | 开放 | 共享
深信服社区致力于打造开放共享的技术社区。如有问题,可私信管理员 @七嘴八舌bar或联系 0755-86725929
智能客服总接入量 556w+
论坛总帖数 +6 156002

关注我们了解更多>

关注技术服务公众号

关注微信小程序