|
本发明涉及音频处理领域,具体涉及一种录音融合方法。
1 A% R' h! }8 r3 n; ^
8 x/ G) {3 G% D0 Q2 h* l8 |" d3 z/ x% `- w
背景技术:
3 [2 W. J/ Z& k( W0 i) F随着唱吧、全民K歌等手机软件及自助式KTV的流行,录音分享越来越普及。但一般用户反复唱同一首歌,很难录到一遍完整无瑕的演唱。经常碰到各处的抢拍、漏词、走调、甚至附近有人故意干扰、说话尖叫。因此有必要提供一种方法,帮助用户获取一个完整的效果最好的录音。
9 l' [( f- C* K; w! J- r( F1 \
3 E" A8 e* ~% j) k& B |技术实现要素:) m5 S( j l; `
本发明的目的就是提供一种录音融合方法,其能够帮助用户获取一个完整的效果最好的录音。) V, s/ V1 t0 ?4 T* v, W
为实现上述目的,本发明采用了以下技术方案:& R) p2 P3 T8 L$ n( D" ~1 g
一种录音融合方法,包括如下操作:* w! f1 }- i6 ^- F
S1:获取同一歌曲的n次录音的录音文件,n≥2;' z/ B- Y, N# S* o
S2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;7 S& L N/ ?/ y( @: H
S3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。5 |- z& K1 `$ ~
进一步的方案为:1 [1 Z! ]! N0 p
步骤S2中录音文件切分方法为:录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的录音文件的首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音文件分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。( y9 f6 Q3 P* L9 X5 L* r9 Q
步骤S3中融合拼接采用淡进淡出算法。8 G- ?7 \4 b' `
步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。亦即采用KTV的精确评分方法进行评分。" t0 V7 V% A+ ?# H/ G* S7 K- @) N
上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。
1 S. ?( }7 M+ U8 W( u7 }2 s9 a, u附图说明
3 H, ~+ G- a& n8 ^图1为本发明的流程示意图;: n6 ]* i! z4 R+ t4 j6 |
图2为录音文件切分、拼接示意图;" a. k5 ]- E/ h
图3为评分方法示意图;
" k- L8 e6 l+ `+ z y f) i图4为融合拼接的示意图。8 y q3 C' I- A8 ]5 Z4 }
具体实施方式
: d: `- e, f! \: K: s为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行具体说明。应当理解,以下文字仅仅用以描述本发明的一种或几种具体的实施方式,并不对本发明具体请求的保护范围进行严格限定。
4 l8 {9 ~5 v! Q% ^本发明采取的技术方案如图1、2、3、4所示,一种录音融合方法,包括如下操作:
+ c) P4 d( C4 V' d( g& AS1:获取同一歌曲的n次录音的录音文件,n≥2;各录音文件分别记为录音1、录音1……录音n;
6 E- {9 B2 I9 ~: h7 `S2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;如录音1切分后的唱段依次为C11、C12……C1m;录音2切分后的唱段依次为C21、C22……C2m……录音n切分后的唱段依次为Cm1、Cm2……Cmn;采用同样的评分方法对C11、C12……C1m、C21、C22……C2m……Cm1、Cm2……Cmn分别进行评分,比较同一时段各唱段的评分,如C11、C21……Cm1为同一时段的唱段,比较其评分选取出评分最高的记为C1-best;C12、C22……Cm2为同一时段的唱段,比较其评分选取出评分最高的记为C2-best; Cm1、Cm2……Cmn为同一时段的唱段,比较其评分选取出评分最高的记为Cm-best,如图2所示;
R) p+ V0 B% V# z& t+ KS3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。亦即将步骤S2中选取出的唱段C1-best、C2-best……Cm-best按照时序融合拼接获取得到录音文件。) r* V4 O5 Q$ [/ R9 L8 {, M& ~: J
上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。6 X# [) b |. _
步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。分数高代表歌唱的匹配度高、唱得好,分数低代表歌唱的匹配度低、唱得差,这个分数将在本发明中起到重要作用。 e2 T5 L! v4 [: U
图3为一段典型的歌声(无伴奏)的分析:第一行是歌声,可以清晰的看到一段声音静息的分界点(红框),每个分界点代表一段歌词结束,歌唱者在换气或者等待第二段歌词出现;第二行是声音端点检测结果,每个小方块代表一个吐词,小方块的长短代表发音的长度,大的空隙是歌词的停顿处;第三行是每个声音的基频分析结果,基频代表了音调;这样的歌声分析我们获得了基频和发音长度两个基本参数,通过和原唱的参数的比对可以检测到歌唱者是否有抢拍、漏词、走调等问题,并给出具体的歌唱评分,而且是每个发音,每句歌词可以有单独的评分。3 r- ?9 g% c( W
步骤S2具体的操作为:基于同一个MTV录音,至少需要有两个录音文件和相关的评分结果;基于同一首歌的录音一般是大致等长的,但声音不一定同步,每个录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的文件首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音数据分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。& c. Z- }* |# q; i
步骤S3中融合拼接采用淡进淡出算法,如图4所示,使用淡进淡出算法,并且只使用在唱段的间隙处,即前一唱段最后一个发音结束后,音量逐渐减少到0,后一唱段第一个发音前,音量从0逐渐增加到正常值,然后两个相加。8 V: g/ d2 [5 q/ q. d' W' e( V
本发明利用了KTV的精确评分,将同一个人同一首歌的不同录音根据歌词的分界点切分成各唱段,然后将等分最高的几段拼接融合在一起,从而极大提高了唱歌的乐趣。6 I r+ u: {8 t: `* C- _" l( L
本发明未能详尽描述的设备、机构、组件和操作方法,本领域普通技术人员均可选用本领域常用的具有相同功能的设备、机构、组件和操作方法进行使用和实施。或者依据生活常识选用的相同设备、机构、组件和操作方法进行使用和实施。
. X- M O5 |. L8 z4 ~# [以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在获知本发明中记载内容后,在不脱离本发明原理的前提下,还可以对其作出若干同等变换和替代,这些同等变换和替代也应视为属于本发明的保护范围。
* [) G- t+ R' i! _, f" A
H% g A: X+ z1 y- V' @$ u% S' j8 r$ G. |+ Y
技术特征:
8 }7 A% g G6 d1 k4 o! i1.一种录音融合方法,包括如下操作:. G$ n; w6 u6 ^! w: U
S1:获取同一歌曲的n次录音的录音文件,n≥2;
* g- X( `9 v, T/ e" z0 US2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;9 \7 @1 q- t5 E* N, s2 s
S3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。
" P. B5 g) E8 p2.根据权利要求1所述的录音融合方法,其特征在于,步骤S2中录音文件切分方法为:录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的录音文件的首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音文件分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。% `% m; N* r& B$ Z" A
3.根据权利要求1或2所述的录音融合方法,其特征在于,步骤S3中融合拼接采用淡进淡出算法。
: s) D$ Y$ |& n( K2 Z4.根据权利要求1或2所述的录音融合方法,其特征在于,步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。( t" ^0 ?3 g3 b Y/ f+ X" Y) ]
技术总结
! k' l# J- l8 `本发明涉及一种录音融合方法,包括获取同一歌曲的n次录音的录音文件;采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。, x3 u" N0 t% R& P% \9 D8 f
|
|