首页
人工智能
网络安全
手机
搜索
登录
搜索
golden81
累计撰写
154
篇文章
累计收到
0
条评论
首页
栏目
首页
人工智能
网络安全
手机
作者 【1】 的文章
2025-4-22
《解锁增强型上下文学习,打造你的专属智能助手》
个性化人工智能助手已成为人们生活和工作中的得力伙伴。从帮我们规划日常行程,到辅助处理复杂的工作任务,它们的存在让许多事务变得更加高效。而增强型上下文学习技术,就像是为这些助手注入了“智慧灵魂”,极大地提升了它们的性能,让交互变得更自然、更智能。 一、增强型上下文学习技术是什么 想象一下,你和朋友聊天,朋友提到昨晚看了一部很棒的电影。即使他没有说电影名字,你也能结合之前的对话和对他喜好的了解,大致猜出他可能看的电影类型。增强型上下文学习技术对于人工智能助手来说,就有着类似的“理解”能力。 传统的人工智能助手在理解用户指令时,常常局限于当前输入的内容。比如你问“那部科幻电影怎么样”,如果没有更多的背景信息,它可能会一头雾水,不知道你说的是哪部科幻电影。但具备增强型上下文学习技术的助手就不同了。它不仅会分析你当前的提问,还会回顾你们之前的对话记录,甚至了解你的兴趣偏好等历史数据。如果你之前和它讨论过几部热门科幻电影,它就能结合这些上下文信息,更准确地理解你说的可能是哪部电影,从而给出更贴合你需求的回答。 这项技术主要通过深度神经网络和大数据分析来实现。它会对大量的用户交互数据进行学习,包括对话内容、提问习惯、使用场景等。通过这些学习,人工智能助手能够构建起一个关于用户的“认知模型”,就像在它的“大脑”里建立了一个用户信息数据库,当用户再次提问时,它可以快速调用这些信息,准确理解用户意图。 二、增强型上下文学习技术如何提升个性化人工智能助手性能 1. 更精准的意图理解 在日常使用中,我们的语言表达往往很灵活,同一个意思可能有多种表达方式。比如,想要了解明天的天气,有人会直接问“明天天气如何”,也有人会说“明天出门不知道该穿啥,天气咋样”。对于个性化人工智能助手而言,准确理解这些不同表述背后的真实意图至关重要。增强型上下文学习技术让助手能够学习到大量类似的语言表达模式。通过对这些模式的分析和记忆,当它接收到用户的问题时,能够迅速在已学习的模式中进行匹配和判断,从而准确把握用户意图。即使问题表述模糊,它也能结合上下文信息,推测出用户想要了解的内容。例如,你和助手的对话中多次提到近期要出门旅行,之后你问“准备些啥合适呢”,助手就能依据之前的旅行相关话题,判断出你可能是在询问旅行需要准备的物品,而不是其他日常事务。 2. 更连贯的对话体验 在多轮对话中,上下文的连贯性至关重要。具备增强型上下文学习技术的个性化人工智能助手就像是一个善解人意的交谈伙伴,能够始终保持对对话主题的关注和理解。当你和它围绕某个主题展开讨论时,它会记住之前每一轮对话的内容和要点。比如你在讨论一款新手机,先是询问它的性能参数,接着问价格,然后又问哪里能买到。助手会记住这些问题之间的关联,知道它们都围绕着这款新手机展开。在回答你关于购买渠道的问题时,它不会突然偏离主题,而是基于之前对手机的讨论,给出相关且连贯的回答,比如推荐一些可靠的购买平台,并结合之前提到的价格信息,提醒你注意不同平台的价格差异。这种连贯的对话体验,让用户在与助手交流时,感觉更加流畅自然,仿佛是在和一个真正了解自己需求的朋友对话。 3. 个性化内容推荐 每个人的兴趣爱好和需求都不尽相同,个性化人工智能助手的一大优势就在于能够根据用户的个性化特点提供精准的内容推荐。增强型上下文学习技术在这方面发挥着关键作用。它通过分析用户的历史交互数据,了解用户的兴趣领域,比如你经常询问关于健身的知识,关注健康饮食,那么助手就会知道你对健康生活方面有浓厚兴趣。当有新的健身课程、健康食谱或者运动装备等相关信息时,它就会主动推送给你。而且,它还能根据你之前对推荐内容的反馈,不断优化推荐策略。如果你对之前推荐的某个健身课程表示很感兴趣,它下次就会推荐更多类似风格和难度的课程;如果你对某个推荐的运动装备不太满意,它会分析原因,在下次推荐时避免类似的产品,从而让推荐内容越来越贴合你的个人喜好。 三、增强型上下文学习技术的实际应用场景 1. 智能办公助手 在繁忙的工作场景中,增强型上下文学习技术能让办公助手成为员工的贴心伙伴。比如,你正在准备一个重要的项目汇报,之前和助手讨论过项目的背景、目标以及一些关键数据。当你询问“帮我生成一个项目汇报大纲”时,助手会结合之前了解到的项目信息,快速生成一个符合项目需求的大纲框架。它不仅会涵盖项目的重点内容,还能根据你平时的汇报风格和习惯,调整大纲的结构和表述方式。在后续的修改过程中,你提出“增加一些市场分析的数据”,助手能马上明白你是针对刚才生成的汇报大纲进行修改,并且根据之前对项目的了解,准确地找到相关市场分析数据添加到大纲中,大大提高了工作效率。 2. 智能教育辅导 在教育领域,这种技术为学生提供了个性化的学习辅导。以学习英语为例,学生在和智能辅导助手交流时,助手会记录下学生的学习进度、薄弱环节以及学习习惯等信息。如果学生问“这个单词的用法我不太明白”,助手会结合学生之前的学习情况,比如学生之前在语法方面比较薄弱,就会重点从语法角度讲解单词的用法,并提供一些适合该学生水平的例句和练习题。当学生再次提问其他英语相关问题时,助手能根据之前的学习过程,给出有针对性的解答和学习建议,就像一个专属的私人教师,陪伴学生逐步提升英语能力。 3. 智能生活助手 在日常生活中,智能生活助手利用增强型上下文学习技术,给我们带来了诸多便利。比如你在规划周末旅行,之前和助手讨论过想去海边城市。当你问“那边有什么好玩的景点”时,助手会结合之前的对话,知道你说的是海边城市,从而推荐一些当地著名的海滩、海岛等景点。并且,它还会考虑到你之前提到的兴趣爱好,如果你喜欢历史文化,它可能会在推荐景点时,介绍一些当地具有历史意义的渔村或者海边古迹。当你确定好景点后,询问周边的餐厅,助手又能根据之前推荐的景点位置,推荐一些附近口碑不错的海鲜餐厅,让你的旅行规划更加轻松便捷。 尽管增强型上下文学习技术为个性化人工智能助手带来了显著的性能提升,但它也面临一些挑战。例如数据隐私保护问题,在收集和分析大量用户数据的过程中,如何确保用户信息不被泄露;还有算法的优化问题,如何让模型在更复杂的情况下,依然能够快速准确地处理上下文信息。不过,随着技术的不断发展和完善,相信这些问题都将逐步得到解决,未来我们与个性化人工智能助手的交互也将更加智能、自然和高效。
2025年-4月-22日
15 阅读
0 评论
人工智能
2025-4-22
自训练与一致性正则化:半监督学习的混合匹配方法
在机器学习领域,获取大量标注数据往往成本高昂且耗时。半监督学习作为一种解决方案,旨在同时利用有限的标注数据和大量的未标注数据进行模型训练。近年来,自训练、一致性正则化以及混合匹配等技术在半监督学习中取得了显著突破。本文将深入探讨这些方法的理论基础、实现机制及其在现代深度学习中的应用。 自训练(Self-training) 基本原理 自训练是半监督学习中最直观的方法之一,遵循"教师-学生"模式。其核心思想是: 首先使用有限的标注数据训练一个初始模型(教师模型) 利用该模型对未标注数据进行预测,生成伪标签(pseudo-labels) 选择预测置信度高的样本与原始标注数据一起,重新训练模型 迭代上述过程,不断扩充"可信"的训练数据集 自训练的成功关键在于伪标签的质量控制。如果模型对某些样本的错误预测被纳入训练集,可能导致错误累积,使模型性能下降。 现代自训练技术 现代自训练方法采用了多种改进策略: 动态阈值:根据模型训练阶段动态调整选择伪标签的置信度阈值 类别平衡:确保各类别的伪标签样本数量相对均衡 多视角自训练:从不同的数据表示或模型架构获取多个独立的伪标签,通过集成减少错误 一致性正则化(Consistency Regularization) 理论基础 一致性正则化基于平滑假设(Smoothness Assumption):如果两个输入点在高密度区域相近,则它们的输出也应该相近。具体来说,对同一未标注样本施加不同的数据增强或扰动后,模型应该产生一致的预测结果。 数学表达 一致性正则化可以表示为最小化以下损失函数: $$\mathcal{L}{cons} = \mathbb{E}{x \in \mathcal{D}_u, \eta, \eta'} \left[ d(f(x, \eta), f(x, \eta')) \right]$$ 其中: $\mathcal{D}_u$ 表示未标注数据集 $\eta, \eta'$ 表示不同的随机扰动或增强 $f(x, \eta)$ 表示模型对扰动后样本的预测 $d(\cdot, \cdot)$ 表示某种距离度量(如均方误差或KL散度) 代表性方法 几种经典的一致性正则化方法包括: Π模型:对同一样本进行两次前向传播,两次使用不同的数据增强和随机丢弃(dropout) 时序集成(Temporal Ensembling):维护模型在不同训练阶段对同一样本预测的指数移动平均 平均教师(Mean Teacher):维护一个教师模型,其参数是学生模型参数的指数移动平均 混合匹配(MixMatch) 方法概述 混合匹配是一种将自训练、一致性正则化和数据增强有机结合的半监督学习算法,由Google Research于2019年提出。它创新地将多种有效的半监督学习思想整合到一个统一的框架中。 核心步骤 MixMatch对于每个小批次的标注数据和未标注数据执行以下操作: 增强与标签猜测: 对每个未标注样本生成K个增强版本 模型对这K个版本进行预测,并平均结果 对平均预测应用温度锐化(temperature sharpening)以提高置信度 **混合操作(MixUp)**: 将标注数据和带伪标签的未标注数据合并成一个池 对每个样本,随机选择另一个样本进行线性插值,创建新样本 同时对其标签/伪标签进行相同比例的插值 联合训练目标: 对标注数据使用标准交叉熵损失 对未标注数据使用均方误差损失(伪标签作为目标) 总损失为两部分的加权和 数学表达 MixMatch的总体损失函数可表示为: $$\mathcal{L} = \mathcal{L}_x + \lambda \mathcal{L}_u$$ 其中: $\mathcal{L}_x$ 是标注数据的监督损失 $\mathcal{L}_u$ 是未标注数据的一致性损失 $\lambda$ 是平衡两种损失的权重系数 技术比较与融合应用 方法对比 方法 优势 局限性 自训练 实现简单,适用性广 易受错误伪标签影响,存在确认偏差 一致性正则化 不依赖伪标签质量,理论基础扎实 可能需要大量未标注数据,超参数敏感 混合匹配 融合多种技术优势,性能突出 计算成本较高,实现复杂 实际应用中的融合策略 在实际应用中,这些方法常常结合使用以取得更好效果: 渐进式训练:先使用一致性正则化建立稳定模型,再引入自训练扩展标签空间 混合匹配变体:如FixMatch,简化了混合匹配流程,结合强弱数据增强与伪标签技术 预训练与微调:首先使用自监督学习进行预训练,再应用这些半监督方法微调
2025年-4月-22日
10 阅读
0 评论
人工智能
2025-4-22
入选AAAI 2025,浙江大学提出多对一回归模型M2OST,利用数字病理图像精准预测基因表达
数字病理图像作为一种全切片病理图像 (WSIs),能够对组织切片的高分辨率数字化呈现,全面展示细胞形态、结构和空间分布特征。与传统玻璃切片相比,WSIs 不仅便于存储和分析,还能在多个尺度上提供更直观的组织视图,因而在病理诊断与生物医学研究中应用日益广泛。通过对这些图像的分析,科研人员可以探索细胞空间组织与基因表达之间的内在联系,从而揭示多细胞系统中复杂的转录调控机制。 近年来,空间转录组学 (Spatial Transcriptomics, ST) 作为单细胞 RNA 测序的空间延伸技术,已成为研究细胞亚型分布、互作关系和分子机制的重要工具。然而,受限于其高昂的设备和试剂成本,ST 技术在实际应用中仍面临普及难题。相较之下,WSIs 更具经济性和可及性,在临床应用上更为经济且易于获取。因此,如何借助深度学习手段,从 WSIs 中低成本重建 ST 图谱,成为一个备受关注的研究方向。 现有方法多将 ST 预测问题视为传统的回归问题,使用单级图像 - 标签对进行训练。这使得它们只能对最大放大倍数图像的基因表达关系进行建模,浪费了 WSIs 固有的多尺度信息。 基于这一问题,中国浙江大学的林兰芬教授研究团队联合浙江杭州之江实验室以及日本立命馆大学共同提出了 M2OST,这是一种多对一回归 Transformer 模型,旨在利用不同层次的病理图像共同预测基因表达。 通过整合 WSIs 中的采样点视觉信息和多尺度特征,该模型能够生成更准确的 ST 图谱。此外,研究团队还将多对一的多层特征提取过程解耦为层内特征提取和跨层特征提取,在不影响模型性能的情况下大大降低了计算成本,优化了计算效率。 相关成果以「M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images」为题,入选 AAAI 2025。 研究亮点: 将 ST 预测问题概念化为多对一建模问题,利用分层结构 WSIs 中嵌入的多尺度信息和点间特征,联合预测 ST 图谱 提出基于多对一回归的 Transformer 模型 M2OST,对不同序列长度的输入集具有鲁棒性 将 M2OST 中的多尺度特征提取过程解耦为层内特征提取和跨层特征提取,在不影响模型性能的情况下显著提高了计算效率 对提出的 M2OST 方法进行了全面的实验,并在 3 个公开的 ST 数据集上证明了其有效性 论文地址:https://arxiv.org/abs/2409.15092 关注公众号,后台回复「M2OST」获取完整 PDF 开源项目「awesome-ai4s」汇集了 200 余篇 AI4S 论文解读,并提供海量数据集与工具: https://github.com/hyperai/awesome-ai4s 数据集:使用 3 个 ST 数据集证明其有效性 研究团队使用了 3 个公开的 ST 数据集来评估所提出的 M2OST 模型的性能: *人类乳腺癌数据集 (HBC): 包含 68 个 WSI 中的 30,612 个点位,每个点位至多有 26,949 个不同的基因。该数据集中的点直径为 100μm,以 200μm 的中心距排列成网格。 *人类阳性乳腺肿瘤数据集 (HER2): 由 36 个病理图像和 13,594 个点位组成,每个点位包含 15,045 个已记录的基因表达数据。该数据集中的 ST 数据每个捕获点之间的中心距为 200μm,每个点的直径为 100μm。 *人类皮肤鳞状细胞癌数据集 (cSCC): 包括 12 个 WSI 和 8,671 个点位。该数据集中的每个点位都对 16,959 个基因进行了分析。所有点的直径为 110μm,排列成中矩形点阵,中心距为 150μm。 M2OST 模型:多对一回归结构,多层次病理图像共同预测基因表达 近年来,从全切片病理图像 (WSIs) 中预测空间转录组 (ST) 图谱成为当前数字病理学领域中的研究热点。早期方法如 ST-Net 和 DeepSpaCE 基于卷积神经网络 (CNN) 进行图像块级别的 ST 预测。近期发布的双模态嵌入框架 BLEEP 引入对比学习策略,将 WSI 图像块特征与 ST 点嵌入对齐,并引入 K 近邻算法缓解推理阶段的批次效应问题。 随着基于 Transformer 的模型兴起,其性能已超越传统 CNN。深度学习模型 HisToGene 首次将 Transformer 引入基因表达预测,实现玻片级建模,提升了效率但仍受限于计算资源。Hist2ST 模型在此基础上融合 CNN、Transformer 与图神经网络,进一步捕捉长距离依赖,但其复杂的模型结构也导致过拟合风险上升。 与主流关注采样点间相关性的思路不同,基于分层图像特征提取的方法 iStar,强调采样点内的基因表达仅与其对应的图像块区域相关,采用预训练的 HIPT 进行特征提取,并通过 MLP 映射至表达值,性能优越,但由于特征不可学习,仍存在进一步优化空间。 研究团队受此启发,M2OST 同样采用了图像块级方案,一次预测一个采样点,确保每个预测的独立性与准确性。 研究团队还进一步拓展了 iStar 的思路,设计了一套可学习的多尺度特征提取与融合模块,通过对局部区域的精细建模和跨尺度信息整合,提升模型在复杂组织结构下的预测能力。 如下图所示,来自不同全切片病理图像 (WSIs) 层级的 3 个图像块序列被输入到模型中,以共同预测相应位点的基因表达。 在接收到来自 3 个不同层次的病理图像块后,首先,M2OST 会将它们送入可变形图像块嵌入层 (DPE), 以实现自适应 token 生成。DPE 不仅能从每张图像中提取基础病理图像块,还能在高层次的病理图像中引入更大尺寸的图像块,从而捕捉更广泛的上下文信息。 同时,DPE 通过生成细粒度的点内 token 和粗粒度的周围 token,以强化模型对采样点中心区域特征的关注,从而在多对一的建模过程中突出采样点间特征 (inter-spot features),为后续的表达预测提供更精细、结构化的特征表示。 ::: hljs-center M2OST 模型示意图 ::: ::: hljs-center 在 M2OST 中使用的 DPE ::: 而后,在每个序列中添加 cls token,并如图中 PE 所示,引入可学习的位置编码,M2OST 使用内层 token 混合模块 (ITMM) 对每个序列进行层内特征提取。 ITMM 基于 Vision Transformer 架构构建,并引入随机掩码自注意力机制 (Rand Mask Self-Attn),以增强模型在图像建模过程中的泛化能力。 ::: hljs-center ITMM 的网络结构 ::: 在层内特征提取完成后,M2OST 引入跨层 token 混合模块 (CTMM),用于促进多层序列之间的跨层信息交互。 由于多尺度输入序列的长度存在差异,CTMM 通过引入全连接跨层注意力机制以避免直接融合造成的信息失真,同时保持每个尺度分支参数的相对独立性。随后,为了增强通道级的跨尺度信息交换能力,M2OST 在 CTMM 之后引入了跨层通道混合模块 (CCMM)。 CCMM 采用对序列长度不敏感的结构设计,CTMM 根据不同层之间的注意力相似度和可学习权重,动态整合跨尺度的上下文信息,输出同形状的多层序列。 首先对每个层次的序列进行全局平均池化 (Global Avg Pooling),将其序列信息压缩为一个 token 表示,然后将不同层次的 token 组合在一起,并结合挤压激励机制 (Squeeze & Excitation) 计算跨层通道注意力分数。这些分数随后被映射回各自的输入序列,完成通道级的跨尺度信息交换。 ::: hljs-center (a) CTMM 的网络结构。(b) CCMM 的网络结构。 ::: 该多尺度特征建模过程整体构成 M2OST 的编码器模块,并在整个网络中迭代 N 次,以逐步丰富空间转录组预测所需的多层次、高表达力的图像表征。** 最后,将 3 个 cls token 连接起来,送入线性回归头部进行 ST 点预测。** 实验结果:多维度评估证明 M2OST 模型有效性 研究团队全面比较了 M2OST 与多种主流方法在多个数据集上的表现。实验结果如下表所示,** M2OST 在更少的参数量和更少的 FLOPs 下,实现了更为优越的性能。** 与 ST-Net 相比,M2OST 的参数量减少了 0.40M,FLOPs 降低了 0.63G,而 M2OST 在 HER2+ 和 cSCC 数据集上的皮尔逊相关系数 (PCC) 分别提升了 1.16% 和 1.13%。 ::: hljs-center M2OST 与其他方法的比较实验结果 ::: M2OST 与一对一多尺度方法的比较: 研究团队还将 M2OST 与普通的一对一多尺度方法进行了比较,如 CrossViT 和 HIPT/iStar。相较于标准 ViT,CrossViT 展现出更强的 ST 回归能力,证实了在该任务中整合多尺度信息具有显著优势。然而,CrossViT 在点内信息建模方面存在一定限制,其整体性能仍不及 M2OST。 此外,iStar 在 ST 预测准确性上表现出色,证明了 HIPT 架构在从 WSI 中提取多尺度特征方面的有效性。然而,为了节约计算成本,iStar 采用固定的 HIPT 权重来生成用于 ST 预测的 WSI 特征,限制了其特征提取能力。同时,在推理效率方面,iStar 的逐块、逐尺度的提取流程显著增加了处理时间。研究结果表明,当在相同的 GPU 内存限制下运行,M2OST 的推理速度比 iStar 快约 100 倍,且性能仍优于后者,充分展示了端到端训练在 ST 回归任务中的潜力和 M2OST 模型的有效性。 图像块级和玻片级 ST 方法的比较: 实验结果显示,玻片级方法在 3 个数据集上的表现普遍不及图像块级方法。尽管 Hist2ST 相较于 HisToGene 展现出更强性能,但其大量参数和高 FLOPs 使得这种性能的提升意义不大。与 ST-Net 等基线图像块级方法相比,Hist2ST 在 3 个数据集上的 PCC 分别降低 2.78%、2.99% 和 2.66%。这表明一个点的基因表达主要与其对应的组织区域相关,引入点间相关性并未显著提升预测准确性。尽管如此,玻片级方法在生成完整 ST 图谱方面仍具优有更高的效率,未来通过优化网络设计,仍有潜力实现具有竞争力的回归精度。 可视化分析: ::: hljs-center (a) 主成分分析 (PCA) 之后的空间转录组 (ST) 图谱的可视化结果。 (b) DDX5 基因空间分布的可视化结果。 ::: 研究团队对不同方法在 ST 图谱预测中的可视化结果进行了分析对比,结果显示玻片级方法(如 HisToGene 和 Hist2ST)通常能够生成更平滑的图谱,而图像块级方法则保留了更清晰的局部结构特征。 值得注意的是,M2OST 始终能够生成更准确的 ST 图谱,呈现出更高的预测精度。研究团队进一步对关键基因 DDX5 的表达进行了可视化,DDX5 通过激活 β - catenin 信号通路,在非小细胞癌细胞的增殖和肿瘤发生中起关键作用。结果表明 M2OST 在该基因的预测中表现最优,优于所有对比方法,验证了 M2OST 模型在单基因表达预测水平上的准确性。 空间转录组学的突破性进展与跨领域应用 空间转录组学作为连接细胞功能与组织结构的桥梁,能够解析单个细胞在时间和空间维度上的基因表达模式,并揭示细胞类群的空间位置及其生物学特征,正推动生物医学研究向更深层次发展。 在这一领域,2025 年 4 月, 日本东京大学医科学研究所的研究团队开发了基于图像辅助的图对比学习进行空间转录组学分析的深度学习框架 STAIG。 该框架能够整合基因表达、空间数据和组织学图像,且不需要对齐数据,从而克服了传统方法在消除批次效应和识别空间区域上的局限性。STAIG 通过自监督学习,从苏木精和伊红 (H&E) 染色图像中提取特征,无需依赖大规模数据集进行预训练。 在训练过程中,STAIG 动态调整图结构,并通过组织学图像选择性排除无关的负样本,减少了偏差。最终,STAIG 通过局部对比分析基因表达的共性,成功实现了批次整合,避免了手动坐标对齐的复杂性,显著减少了批次效应。研究表明,STAIG 在多个数据集上表现出色,特别是在空间区域识别方面,能够揭示肿瘤微环境中的详细基因和空间信息,展现出其解析空间生物学复杂性的重要潜力。 点击查看详细报道:无需预对齐即可消除批次效应,东京大学团队开发深度学习框架STAIG,揭示肿瘤微环境中的详细基因信息 与此同时,中国上海临港实验室魏武研究团队也在空间转录组学领域取得了显著进展。2024 年 11 月,团队在 Briefings in Bioinformatics 期刊上发表了题为「MCGAE: unraveling tumor invasion through integrated multimodal spatial transcriptomics」的研究论文。该研究开发了专为空间转录组数据分析设计的深度学习框架 MCGAE (Multi-View Contrastive Graph Autoencoder), 该框架通过结合基因表达、空间坐标和图像特征,创建多模态、多视图的生物表征,显著提升了空间域识别的准确性。 在肿瘤数据中展现了对肿瘤区域的精确识别与分子调控特征的深度解析,为复杂组织、疾病机制研究和药物靶点发现提供了强有力的工具。 论文原文:https://academic.oup.com/bib/article-pdf/26/1/bbae608/60786360/bbae608.pdf 此外,空间转录组学在农业领域的应用也展现出巨大潜力。2025 年 4 月,北京大学现代农业研究院的研究团队在 Genome Biology 上发表了一项题为「Spatiotemporal tranomics reveals key gene regulation for grain yield and quality in wheat」的重要研究, 利用空间转录组技术构建了小麦籽粒发育早期不同时间段的高分辨率基因表达图谱, 揭示了小麦籽粒发育过程中的基因表达特征。这一研究不仅为小麦的分子设计育种与产量提高提供了重要的理论支持,也为全球粮食安全提供了有力保障。 论文原文:https://www.biorxiv.org/content/biorxiv/early/2024/06/03/2024.06.02.596756.full.pdf 未来,随着空间转录组数据的不断积累和数字病理图像获取手段的持续优化,人工智能与组学技术的深度融合将推动深度学习模型在多种组织类型和疾病背景中的广泛应用,助力精准医疗的发展。M2OST 的提出为构建高效、低成本、高精度的空间基因表达预测框架奠定了坚实基础,预示着人工智能与多组学数据融合分析在生物医学领域的深远前景。
2025年-4月-22日
11 阅读
0 评论
人工智能
2025-4-22
软件开发分为多少个阶段
软件开发分为多少个阶段 第一阶段:需要分析及确认阶段 系统需要分析阶段,明确项目需求,确保所有利益相关者对项目目标、功能、性能、安全、用户接口等方面有共同的理解和期望。 需求分析:对收集到的需求进行分类、整理、分析和验证,确定需求的优先级、可行性和相互依赖关系。 需求规格说明书编写:将分析结果以文档形式呈现,详细描述软件的功能需求、非功能需求(如性能、安全性、兼容性等)、用户界面需求等。 需求评审与确认:组织评审会议,邀请用户、项目经理、开发人员等利益相关者对需求规格说明书进行评审,确保各方对需求达成共识。 第二阶段:软件设计及确认阶段,即系统设计阶段 系统架构设计:设计系统的整体架构,包括技术选型、模块划分、组件间交互方式等。 详细设计:针对每个模块进行详细设计,包括接口设计、数据结构设计、算法设计等。 数据库设计:设计数据库结构,包括表结构、关系、索引等。 设计评审与确认:组织设计评审会议,确保设计方案满足需求规格说明书的要求,并具备可实施性。 第三阶段:软件开发编码阶段,即系统开发阶段 编码实现:开发人员根据设计文档进行编码,实现软件系统的各个功能模块。 代码审查:通过代码审查提高代码质量,确保代码符合编码标准、可维护性和可扩展性。 版本控制:使用版本控制系统管理代码,确保代码的可追溯性和团队协作的顺畅。 第四阶段:软件测试修改调优阶段,即系统测试阶段 单元测试:对软件中的最小可测试单元进行测试,确保每个单元都能正常工作。 集成测试:将多个单元组合在一起进行测试,确保单元之间的接口和交互符合预期。 性能测试:测试软件在特定条件下的性能表现,如响应时间、吞吐量等。 缺陷跟踪与修复:记录发现的缺陷,跟踪其修复过程,并进行回归测试以验证修复效果。 调优:根据测试结果对软件进行性能优化和代码优化。 第五阶段:软件验收及交付阶段 目标:确保软件满足用户需求,并顺利交付给用户。 验收测试:用户或第三方测试团队对软件进行验收测试,确保软件满足合同或需求规格说明书中的要求。 用户培训:为用户提供必要的培训,使他们能够熟练使用软件。 文档交付:交付用户手册、安装指南、维护手册等文档。 软件部署:将软件部署到用户的环境中,确保软件能够正常运行。 项目总结:对整个项目进行总结,分析项目过程中的成功经验和不足之处。 第六阶段:软件免费维护阶段 在软件交付后的一段时间内(通常为一年或更长),为用户提供免费的技术支持和维护服务。 技术支持:解答用户在使用过程中遇到的问题,提供解决方案或指导。 缺陷修复:对于在免费维护期内发现的软件缺陷,及时进行修复并发布补丁或更新版本。
2025年-4月-22日
6 阅读
0 评论
网络安全
2025-4-22
为什么微软要求驱动程序必须数字签名?
在Windows系统中,驱动程序是硬件与操作系统之间的重要桥梁。然而,当系统提示“驱动程序未经数字签名”时,许多用户会陷入两难:强行安装可能威胁系统安全,放弃安装又会导致硬件无法使用。本文将深入探讨这一问题的成因,并提供3种安全可靠的解决方案,帮助用户既保障系统稳定,又能高效使用硬件设备。 一、为什么微软要求驱动程序必须数字签名? 1. 数字签名的作用 数字签名是微软验证驱动安全性的“身份证”。它通过加密技术证明驱动程序的来源可靠,未被篡改。微软要求所有在Windows 10/11系统上运行的驱动必须通过WHQL认证(Windows Hardware Quality Labs),以确保其兼容性和安全性。 2. 未签名驱动的风险 系统不稳定,未经验证的驱动可能导致蓝屏、崩溃或硬件冲突。恶意软件风险,*击者可能通过未签名驱动植入*毒、*索软件等。更新受阻,Windows更新可能拒绝安装未签名驱动,导致设备无法正常使用。 二、如何检查驱动程序是否已签名? 在尝试解决问题前,建议先确认当前系统中哪些驱动未签名。通过以下PowerShell命令可快速筛查: Get-WindowsDriver -Online -All | Where-Object { $_.DriverSignature -eq "Unsigned" } 该命令会列出所有未签名的驱动文件及其路径,方便用户定位问题。 三、3种安全解决方案详解 方法一:获取微软WHQL认证(推荐长期使用) 适用场景: 硬件厂商或开发者需要为驱动提供长期稳定的数字签名。用户希望彻底解决签名问题,避免反复弹窗警告。 操作步骤: 1.申请EV代码签名证书,通过国际知名CA机构(如DigiCert、Certum、GlobalSign)申请EV代码签名证书。以沃通CA为例,其提供一站式服务,协助完成微软WHQL测试与认证。 优势:EV代码签名证书支持硬件令牌加密,安全性更高,且能直接通过微软认证流程。 2.提交驱动至微软硬件开发中心 完成测试后,将驱动程序提交至微软硬件开发中心(Windows Hardware Dev Center)进行签名。 认证通过后,驱动将获得微软官方数字签名,兼容所有Windows版本。 用户端安装流程: 从硬件官网下载WHQL认证版本驱动。右键点击.inf文件,选择“安装”即可自动通过系统验证。 优势与注意事项: 一劳永逸,无需用户额外操作;提升品牌信任度。WHQL认证周期较长,需预留足够测试时间。 方法二:临时禁用驱动强制签名(适合测试环境) 适用场景: 临时测试未签名驱动(如开发者调试硬件)。紧急情况下需快速使用设备。 操作步骤: 1.进入启动设置 重启电脑时按住Shift键,选择“疑难解答” > “高级选项” > “启动设置”,点击“重启”。 2.禁用驱动强制签名 重启后按F7键选择“禁用驱动程序强制签名”模式。 3.安装驱动 在禁用签名状态下正常安装驱动,重启后系统会恢复强制验证。 优势与注意事项: 操作简单,无需技术背景。重启后失效;长期使用可能暴露系统安全风险。 方法三:手动添加证书到受信任根(适用于可信来源驱动) 适用场景: 驱动由可信机构开发,但未完成WHQL认证。企业内部分发定制驱动。 操作步骤: 1.获取开发商的CA证书 从驱动开发商处下载其根证书(通常为.cer或.crt文件)。 2.导入证书到系统 按Win+R打开运行窗口,输入certmgr.msc,进入证书管理界面。 右键“受信任的根证书颁发机构” > “所有任务” > “导入”,选择证书文件完成安装。 3.重新安装驱动 导入证书后,系统将信任该开发商签名的驱动,安装时不再报错。 优势与注意事项: 适合企业内部或特定合作场景。需确保证书来源绝对可信,否则可能引入安全*洞。 四、未签名驱动的替代方案与安全建议 1. 优先选择官方渠道 定期访问硬件厂商官网,下载已签名的最新驱动版本。避免使用第三方平台提供的“*解版”或“修改版”驱动。 2. 定期检查系统完整性 使用sfc /scannow命令扫描并修复系统文件。启用Windows Defender实时防护,拦截恶意驱动。 3. 企业级安全防护 对于企业用户,可通过组策略(gpedit.msc)统一配置驱动签名策略,平衡安全性与灵活性。 驱动程序未数字签名的问题看似棘手,但通过WHQL认证、临时禁用签名验证或手动添加信任证书,用户可根据实际需求选择最佳方案。对于开发者或企业,申请EV代码签名证书并完成微软认证是最稳妥的长期解决方案;普通用户在紧急情况下可临时禁用签名,但需谨记重启后恢复设置。
2025年-4月-22日
13 阅读
0 评论
网络安全
2025-4-22
Rapidus 已提供 2nm 制程 0.5 版 PDK,与 Tenstorrent 合作芯片目标年内流片
Tenstorrent 将持续在日招募员工,并为日本培训芯片工程师。
2025年-4月-22日
17 阅读
0 评论
手机数码
2025-4-22
联想天禧个人超级智能体 5 月 7 日发布
联想去年 12 月发布了新一代智能体系统“天禧 AS”,并承诺于 2025 年 Q2 落地 AI PC、AI 手机、AI 平板等。
2025年-4月-22日
15 阅读
0 评论
手机数码
2025-4-22
TrendForce:预计中国市场 2025 年人形机器人本体产值将超 45 亿
TrendForce报告显示,2025年中国市场人形机器人本体产值将超45亿元,宇树科技、优必选等6家厂商量产规划超千台。目前主要应用于B端工业场景,C端家用仍面临技术挑战。#人形机器人##智能制造#
2025年-4月-22日
11 阅读
0 评论
手机数码
2025-4-22
天翼 AI 开放平台上线,支持中国电信自研星辰大模型
据中国电信官方介绍,个人用户通过平台可一站式使用中国电信自研星辰大模型的问答助手、超大表格分析、星辰慧笔、多方言识别、文生图等能力。
2025年-4月-22日
12 阅读
0 评论
手机数码
2025-4-22
机器人“电子皮肤”订单爆发式增长,企业 24 小时赶工
据央视新闻报道,从小众产品到机器人的刚需,电子皮肤应用快速增长,生产研发也在提速。记者在广东和浙江走访中了解到,目前我国在电子皮肤领域具备相对优势,产能也有望进一步突破。
2025年-4月-22日
12 阅读
0 评论
手机数码
12
13
14