版本号:v0.1.0 最后更新:2026-04-04
本文档用于定义本项目中算法链的组织方式、分层原则、分类维度和第一版链模板目录。
本文件的目标不是描述单个算法实现细节,而是建立一套可供 AI分析员调用、组合、评估和迭代的算法链体系。
算法链不能被视为临时拼接的内部实现细节。
在本项目中,算法链应被视为正式的实验方法单元,具备:
不同分析阶段要解决的问题不同,因此不能用一条统一 pipeline 覆盖全部分析任务。
系统必须允许:
算法链体系的设计目标不是让人手动操作更方便,而是让 AI分析员能够:
算法链体系建议按三个维度组织:
目的:
典型模块:
audio_normalizemono_convertresample_16kdenoise_basicbandpass_filter目的:
典型模块:
energy_probespectral_probeonset_probeperiodicity_probeharmonicity_probe目的:
典型模块:
segment_energy_basedsegment_vad_basedsegment_onset_basedsegment_repeat_based目的:
典型模块:
spectrogram_extractmfcc_extractcepstrum_extractembedding_extracttemporal_stats_extract目的:
典型模块:
autocorrelation_period_checkcepstrum_period_checkf0_trackingharmonicity_checktransient_density_checksource_separation_basictemplate_repeat_match目的:
典型模块:
baseline_sound_classifieralt_sound_classifiersimilarity_searchanomaly_distance_check目的:
说明:
该阶段通常由 AI分析员主导,不作为普通信号处理模块实现。
第一版建议先定义以下信号画像,用于帮助 AI分析员选择链模板。
特点:
典型例子:
特点:
典型例子:
特点:
典型例子:
特点:
典型例子:
特点:
典型例子:
特点:
典型例子:
AI分析员在不同目标下应选择不同链模板。
目的:
目的:
目的:
目的:
目的:
目的:
目的:
第一版建议至少建设以下链模板。
用途:
模板:
audio_normalize
-> mono_convert
-> resample_16k
-> energy_probe
-> spectral_probe
-> onset_probe
-> periodicity_probe
主要产出:
用途:
模板:
segment_repeat_based
-> autocorrelation_period_check
-> cepstrum_period_check
-> repeat_interval_estimate
主要产出:
用途:
模板:
spectrogram_extract
-> f0_tracking
-> harmonicity_check
-> tonal_stability_check
主要产出:
用途:
模板:
segment_onset_based
-> transient_density_check
-> event_cluster
-> template_repeat_match
主要产出:
用途:
模板:
denoise_basic
-> source_separation_basic
-> embedding_extract
-> reclassify_with_alt_window
主要产出:
用途:
模板:
embedding_extract
-> anomaly_distance_check
-> similarity_search
主要产出:
为了支持 AI分析员调度,每条链或每个模块至少应暴露以下元数据:
建议结构如下:
type ModuleSpec = {
id: string
stage: string
signalProfiles: string[]
goals: string[]
inputFormat: string
outputFormat: string
params: Record<string, unknown>
evidenceKinds: string[]
failureModes: string[]
cost: {
cpu?: number
latency?: number
memory?: number
}
}
AI 并不应该对所有参数无限制搜索。
第一版建议把参数分为三类:
每条链执行完成后,不能只输出结果,还应输出:
EvidenceScoreCardfailureReasons示例失败原因:
no_clear_event_boundaryweak_periodicity_signalunstable_f0_trackclassifier_confidence_collapsedseparation_not_improvedunknown_pattern_out_of_catalogAI分析员后续的调参与换链决策,应建立在这些结构化结果上。
第一版不应追求链模板过多,而应优先保证每类代表链可跑通。
建议优先顺序:
本项目的算法链体系不是普通的数据处理流水线,而是 AI分析员可调用的实验方法库。
算法链必须:
只有在这个前提下,AI 才能真正替代专业使用者完成“选择、验证、分析、评估、结论”这整套流程。