人工智能
评估语音识别 x 大型语言模型 x 文本转语音组合在人工智能面试系统中的应用
中文标题 评估语音识别 x 大型语言模型 x 文本转语音组合在人工智能面试系统中的应用
英文标题
Evaluating Speech-to-Text x LLM x Text-to-Speech Combinations for AI Interview Systems
中文摘…
从DeepSense到Open RAN:动态频谱感知中的AI/ML进展及其应用
中文标题 从 DeepSense 到 Open RAN:动态频谱感知中的 AI/ML 进展及其应用
英文标题
From DeepSense to Open RAN: AI/ML Advancements in Dynamic Spectrum Sensing and Their…
移动边缘计算和开放无线接入网的进步:利用人工智能和机器学习为无线系统赋能
中文标题 移动边缘计算和开放无线接入网的进步:利用人工智能和机器学习为无线系统赋能
英文标题
Advancements in Mobile Edge Computing and Open RAN: Leveraging Artificial Intelligence and…
LookOut:现实世界中的人形自我中心导航
中文标题 LookOut:现实世界中的人形自我中心导航
英文标题
LookOut: Real-World Humanoid Egocentric Navigation
中文摘要
从第一人称观察中预测无碰撞的未来轨迹在人形机器人、VR/AR 和辅助导航等应用中至关重要…
突触束理论用于脉冲驱动的感知运动系统:超过八个独立的突触束会坍缩奖励-STDP学习
中文标题 突触束理论用于脉冲驱动的感知运动系统:超过八个独立的突触束会坍缩奖励 - STDP 学习
英文标题
Synaptic bundle theory for spike-driven sensor-motor system: More than eight…
DeepTelecom:用于信道和MIMO应用的数字孪生深度学习数据集
中文标题 DeepTelecom:用于信道和 MIMO 应用的数字孪生深度学习数据集
英文标题
DeepTelecom: A Digital-Twin Deep Learning Dataset for Channel and MIMO Applications
中文摘要
领域…
面向一种用于形式化多模态需求的领域特定语言
中文标题 面向一种用于形式化多模态需求的领域特定语言
英文标题
Towards a DSL to Formalize Multimodal Requirements
中文摘要
多模态系统,处理如文本、音频和图像等多种输入类型,在软件系统中变得越来越普遍…
具有上下文感知记忆的长上下文语音合成
中文标题 具有上下文感知记忆的长上下文语音合成
英文标题
Long-Context Speech Synthesis with Context-Aware Memory
中文摘要
在长文本语音合成中,当前方法通常在句子级别将文本转换为语音,并连接结果以形成伪段落级别的语音…
参与式设计对话代理对青少年福祉的挑战与机遇
中文标题 参与式设计对话代理对青少年福祉的挑战与机遇
英文标题
Challenges and Opportunities for Participatory Design of Conversational Agents for Young People's Wellbeing…
特权自我访问对人工智能中的内省很重要
中文标题 特权自我访问对人工智能中的内省很重要
英文标题
Privileged Self-Access Matters for Introspection in AI
中文摘要
AI 模型能否进行内省是一个日益重要的实际问题。 但关于内省如何定义尚无共识。 从一个最近提出的…
利用硬件感知计算的混合精度矩阵乘法:一种基于块的方法
中文标题 利用硬件感知计算的混合精度矩阵乘法:一种基于块的方法
英文标题
Leveraging Hardware-Aware Computation in Mixed-Precision Matrix Multiply: A Tile-Centric Approach
中文摘要…
通过在IREE中启用RISC-V微内核支持来加速GenAI工作负载
中文标题 通过在 IREE 中启用 RISC-V 微内核支持来加速 GenAI 工作负载
英文标题
Accelerating GenAI Workloads by Enabling RISC-V Microkernel Support in IREE
中文摘要
该项目使…
传音多语言语音识别系统用于MLC-SLM 2025挑战赛
中文标题 传音多语言语音识别系统用于 MLC-SLM 2025 挑战赛
英文标题
Transsion Multilingual Speech Recognition System for MLC-SLM 2025 Challenge
中文摘要
本文介绍了由传音语音团队为 MLC…
基于人类反馈的动态语音情感识别
中文标题 基于人类反馈的动态语音情感识别
英文标题
Human Feedback Driven Dynamic Speech Emotion Recognition
中文摘要
这项工作旨在探索动态语音情感识别的新领域。 与传统方法不同…
Aura-CAPTCHA:一种强化学习和GAN增强的多模态CAPTCHA系统
中文标题 Aura-CAPTCHA:一种强化学习和 GAN 增强的多模态 CAPTCHA 系统
英文标题
Aura-CAPTCHA: A Reinforcement Learning and GAN-Enhanced Multi-Modal CAPTCHA System
中文摘…
使用光谱分析算法和深度学习进行地球科学应用的机载推理演示
中文标题 使用光谱分析算法和深度学习进行地球科学应用的机载推理演示
英文标题
Demonstrating Onboard Inference for Earth Science Applications with Spectral Analysis Algorithms and…
阿尔法伯克利:一种用于代理系统编排的可扩展框架
中文标题 阿尔法伯克利:一种用于代理系统编排的可扩展框架
英文标题
Alpha Berkeley: A Scalable Framework for the Orchestration of Agentic Systems
中文摘要
在科学设施…
LLMs和代理AI在保险决策中的应用:非洲的机会与挑战
中文标题 LLMs 和代理 AI 在保险决策中的应用:非洲的机会与挑战
英文标题
LLMs and Agentic AI in Insurance Decision-Making: Opportunities and Challenges For Africa
中文摘要
在本工…