这个程序有Bug的个人博客 ~

【CSDN】 【个人博客】 【GitHub】 【博客园】 【简书】

CSDN之家@Code-keys
  • 音视频基础
    • 图像YUV原理
    • 视频IPB帧理
    • 音频频谱解说
    • Android Codec2...
  • 计算机基础知识
    • 计算机组成原理
    • 计算机网络
    • 操作系统
    • 编译原理
    • 数据结构
    • 算法
  • linux嵌入式C/C++
    • Sound-Card
    • BootLoader
    • Kernel
    • Driver
    • 深度解析c++对象模型
    • STL源码剖析
    • Effientive C++
  • 机器学习、AI相关
  • 3D
    • OpenGL
    • 3D目标检测
    • 点云
  • 其他
CSDN | 【Acoustic-3A(AEC+ ANC+AGC)】:音频链路之QCOM-ADSP帧同步模块详细分析 (2/N)
阅读量:2774
总结:时间戳同步模式通过以下机制实现精确的音频帧同步:
    时间戳对齐:基于音频样本的绝对时间戳进行同步
    零值填充:在时间戳较大的路径前面填充零值
    数据丢弃:在必要时丢弃数据以保持同步
    状态管理:在同步状态和起始状态间转换
    缓冲区管理:维护内部缓冲区处理抖动和延迟
这种机制确保了两个音频流在时间上的精确对齐,对于EC、ASR等需要高精度时间同步的应用至关重要。
CSDN | Android Codec2 Filter 算法模块开发指南
阅读量:361
总结:通过本文档的详细介绍,你应该能够
    理解 Android Codec2 Filter 的架构和工作原理
    封装自己的算法模块为 Codec2 组件
    实现 Filter Plugin 并集成到系统中
    通过 JNI 接口在 Java 层调用算法功能
    进行调试和性能优化
CSDN | 【WEKWS】论文解读 && 语音唤醒系统架构详解 && 实战
阅读量:363
总结:WEKWS系统提供了完整的关键词识别解决方案,具有以下优势:
    多模型支持: 提供多种先进的KWS模型架构
    端到端流程: 从数据准备到模型部署的完整流程
    高性能: 在多个数据集上达到业界领先水平
    易用性: 清晰的代码结构和详细的文档
    可扩展性: 支持自定义模型和数据集
CSDN | 《ClearerVoice-Studio》论文拜读 && 适配私有场景噪音Unet去燥网络
阅读量:363
总结:FRCRN_SE_16K是一个完整的语音增强系统,包含以下关键组件:
    数据准备: 音频读取、归一化、分段
    特征提取: STFT变换(复数频谱)
    模型架构: DCCRN(复数UNet + 注意力机制)
    训练流程: 多轮迭代、梯度裁剪、早停
    推理流程: 分段解码、重叠相加
    损失函数: SI-SNR + 复数掩码MSE
CSDN | 从PyTorch/Onnx、AIMET量化到 QNN GPU 部署全流程实战:GPU 推理 300FPS+
阅读量:315
总结:YOLOv8s 从 AIMET 量化到 QNN GPU 部署全流程实战
    环境准备
    量化模型转换
    GPU FP32 推理测试
    测试结果:单次推理稳定在 3~4ms
CSDN | 《GPU高性能编程CUDA实战》
阅读量:1000
总结:本文深入讲解CUDA编程技术
    包括设备选择、内核编程、线程协作等关键概念
    并探讨了不同类型的内存使用策略,如常量内存和纹理内存
    还介绍了图形互操作性、原子操作的重要性以及如何进行多GPU编程
<<<< To Top | OR | More Info >>>>