音声ドリル診断 - 滑舌・抑揚・テンポ・艶・信頼度の改善
![]() |
音声ドリル診断の音声レーダー(単文) |
音声レーダー
- ガイドが流れます
- ドリル文章のカーソル位置の一文がドリル制作者の声で再生します。
- 「ピッ」と、音読を促す音が鳴ります。
- 利用者はマイクに向かって、同じ内容を音読します
音声ドリル診断の例
音声レーダー
- レーダーチャートによる5つの特徴ランキング
- 5つ星結果と声年齢
- 操作用の釦
レーダーチャートによる5つの特徴ランキング
- 滑舌
- 抑揚
- テンポ
- 声の艶
- AI信頼度
「ランキングなどと、けしからん。」とお叱りを受けそうですが、あくまでもサンプル音源グループの傾向をマッピングしたに過ぎません。杞憂せずに、目安としてご利用ください。
滑舌
滑舌ランク = 滑舌レート×5
滑舌レート(0.0~1.0)
滑舌レート = (高周波数判定 + (1-置換率) )÷ 2高周波数判定 = (高周波一致度 + 高周波レベル比)÷ 2 × 最大レベル比置換率 = 置換わったモーラ数 ÷ 全モーラ数 × 2
滑舌サンプル
![]() |
滑舌の詳細情報 |
![]() |
滑舌高周波数帯域と置換わりを示す配色 |
高周波数判定(0.0~1.0)
性別 | レベル1 | レベル2 | レベル3 | レベル4 | レベル5 |
---|---|---|---|---|---|
男♂ | 2000~2499 | 2500~2999 | 3000~3499 | 3500~3999 | 4000~ |
女♀ | 2500~2999 | 3000~3499 | 3500~3999 | 4000~4499 | 4500~ |
- ドリル制作者の滑舌判定用の周波数情報
- 高周波のモーラが4つあり、順に「きょ」、「し」、「き」、「ちょ」です。
- レベル5が二つ、レベル4,3,2は無く、レベル1が二つ
- 利用者「あなた」の滑舌判定用の周波数情報
- 高周波のモーラは3つで、「と」、「き」と「ちょ」。
- レベル3が二つで、レベル2が一つ
- 高周波モーラの一致度
上記例では、「き」「ちょ」の2モーラが一致。従って一致度は2/4 = 0.5 - 高周波数のレベル積算比
ドリル側は、5×2 + 4×0 + 3×0 + 2×0 + 1×2 = 12,
利用者側は、5×0 + 4×0 + 3×2 + 2×1 + 1×0 = 8
で、8/12 ≒ 0.67 - 利用者側は、最大レベル比は、レベル3で、最高レベル5に対し、3/5 = 0.6
高周波判定 = (0.5 + 0.67)÷ 2 × 0.6 = 0.35
置換率(0.0~1.0)
ドリルの読みを基本に、利用者の読みの違いを「置換わり」があったとして判定します。置換率 = (漏れ文字数 + 不要文字数) ÷ (利用者読み文字数 + 漏れ文字数) × 2置換率 = (1+0) ÷ (40+1) × 2 = 0.048 ≒ 0.5正解率 = (1-置換率) = 0.95
滑舌ランク(0~5)
滑舌レート = (高周波判定+正解率)÷2=(0.35+0.95)÷2=0.6505滑舌ランク = 0.6505 × 5 = 3.253
抑揚
抑揚ランク = (音程レート + 音圧レート)÷ 2 ×5
このように、音程・音圧の各レートを平均して求めています。 各レートは更に3つの要素から構成し、
音程レート = 音程差分(A)×0.5 + 音程変化率(B)×0.3 +音程幅(C)×0.2音圧レート = 音圧差分(X)×0.5 + 音圧変化率(Y)×0.3 +音圧幅(Z)×0.2
で求めています。
ブログ「発声から何を計測するか/イントネーション」で抑揚について、イントネーションとアクセントの二面あることを示しました。その際の測定対象は、音程の変化と音圧の変化としましたが、通説の「アクセント強弱は抑揚に含めない」という立場の方々にはお叱りを受けそうですが、音程変化と同等として平均をとっています。
差分、変化率、幅に関しても、「何を測るか?」で議論した計測対象です。良質の音声との比較から抑揚を判定するという点で、ドリル制作者との比較結果を尊重しています。比率を5:3:2としていますが、評価に使用したサンプル音源(老若男女33名)からベストと判断した重み付けです。
抑揚サンプル
![]() |
抑揚の詳細情報 |
読みの途中にある「・」は、滑舌の置換わりで示した「漏れ」「不要」の文字の代替文字です。これにより、「ドリル行」と「あなた行」の表示が上下で並んで見えますので、傾向が比較し易くなります。
音程・音圧をドリルと比較
拍 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
モーラ | こ | の | りょ | ー | り |
ドリル | 中間=3 | 高い=5 | 高い=5 | 高い=5 | 低め=3 |
あなた | 高め=4 | 高め=4 | 高い=5 | 高い=5 | 中間=3 |
一致数 | 0.75 | 0.75 | 1.0 | 1.0 | 1.0 |
レベル差が0 => 一致数+1.0
レベル差が1 => 一致数+0.75
レベル差が4 => 一致数-0.75
音程差分(A) = 一致モーラ数÷全モーラ数 = (13×1+6×0.75-1×0.75)/38 = 0.44
拍 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
モーラ | こ | の | りょ | ー | り |
ドリル | 高い=5 | 高い=5 | 高め=4 | 高め=4 | 高い=5 |
あなた | 高め=4 | 中間=3 | 低め=2 | 中間=3 | 高い=5 |
一致数 | 0.75 | 0.0 | 0.0 | 0.75 | 1.0 |
サンプルでは、レベル差0が12モーラ、レベル差1が15, レベル差4は3。全モーラ数が38なので、
音圧差分(X) = 一致モーラ数÷全モーラ数 = (12×1+15×0.75-3×0.75)/38 = 0.55
音程・音圧変化の頻度を観測
音程変化レート = 中間レベル(=3)をクロスする回数÷全モーラ数
1->3->4
1->3->3->2->3->55->4->3->4->5->4->3->2
サンプルでは、
音程変化レート = 16回 ÷ 37モーラ = 0.432 --> 43.2%
全モーラ数は、この場合、「あなた」のモーラ数です。
次に、この変化レートから対応表を使って、変化率を求めます。
音程変化% | 35 | 30 | 25 | 15 | 5 | 0 |
---|---|---|---|---|---|---|
男性 | 1.0 | 0.9 | 0.8 | 0.5 | 0.3 | 0.0 |
女性 | 1.0 | 0.9 | 0.8 | 0.5 | 0.3 | 0.0 |
音程変化レート 43.2% = 音程変化率 1.00(男性)
音程変化率35%を最大としている根拠
- ポーズの区り単位(ブログ「テンポ/区切りの数」参照方)は16.4モーラ
- ポーズ区切り間に↑↓の高低パターンが最大3つ=6クロス回数
- 6÷16.4 = 0.366 > 35%
音圧変化レート = 中間レベル(=3)をクロスする回数÷全モーラ数
音圧変化レート = 10回÷37モーラ = 0.27 --> 27%
音圧変化% | 40 | 35 | 30 | 20 | 10 | 0 |
---|---|---|---|---|---|---|
男性 | 1.0 | 0.9 | 0.8 | 0.5 | 0.3 | 0.0 |
女性 | 1.0 | 0.9 | 0.8 | 0.5 | 0.3 | 0.0 |
ここから、
音圧変化レート 27% = 音圧変化率 0.71(男性)
音圧変化レート40%を最大としている根拠
- サンプル音源計測から音程変化より高頻度
- 概ね、1割程度上下変化レートが多かった
音程・音圧の最大幅を観測
男性の基本周波数範囲: 88.51Hz ~ 164.51Hz女性の基本周波数範囲: 140.29Hz~265.27 Hz
音程幅Hz | 700 | 650 | 600 | 550 | 500 | 450 | 400 | 300 | 200 | 100 |
---|---|---|---|---|---|---|---|---|---|---|
男性 | 1.0 | 0.85 | 0.70 | 0.55 | 0.40 | 0.30 | 0.25 | 0.10 | 0.10 | 0.10 |
女性 | 1.0 | 1.0 | 1.0 | 1.0 | 1.0 | 0.85 | 0.70 | 0.40 | 0.25 | 0.10 |
サンプルでは、
![]() |
抑揚/音程周波数のエビデンス |
音程幅=694.7Hz => 音程幅(C)=0.98(男性)
音圧幅dBr | 38 | 36 | 34 | 32 | 30 | 28 | 26 | 24 | 22 |
---|---|---|---|---|---|---|---|---|---|
男性 | 1.0 | 0.85 | 0.75 | 0.65 | 0.55 | 0.45 | 0.35 | 0.25 | 0.15 |
女性 | 1.0 | 0.8 | 0.6 | 0.4 | 0.2 | 0.1 |
サンプルでは、
![]() |
抑揚/音圧相対デシベルのエビデンス |
音程レート= 0.44×0.5 + 1.0×0.3 + 0.98×0.2 = 0.716
音圧差分(X)=0.64, 音圧変化率(Y)=0.71, 音圧幅(Z)=0.95から
音圧レート=0.55×0.5 + 0.71×0.3 + 0.95×.2 = 0.678
抑揚ランク (0~5)
抑揚ランク =(音程レート + 音圧レート)÷2×5 = (0.716+0.678)÷2×5 ≒ 3.49
で、エビデンス表示に一致します。
テンポ
テンポレート
テンポレート = (区切りレート + 速度レート)÷ 2
テンポサンプル
![]() |
テンポの詳細情報 |
区切り位置と数の判定
区切り位置は、ドリル制作者のポーズ位置と利用者である「あなた」の位置を比較し、一致率を観ます。
区切り数は、標準区切りモーラ数から、対象の文章に必要な区切り数と実際の区切り数を比較します。
区切レート = (区切位置一致率(0.0~1.0) + 区切数一致率(0.0~1.0))÷2
区切り位置一致率
区切り位置を、ドリル側と利用者側で比較します。ドリルの全区切り数に対し、いくつ一致したかで判定します。
区切り位置一致率 = 一致数 ÷ ドリル全区切り数
テンポサンプルでは、ドリルの区切り数が一つで、あなの区切りも一つかつ一致していますから、
区切位置一致率 = 1 ÷ 1 = 1.0
区切り数一致率
ブログ「テンポ/区切りの数」で、標準区切りモーラ数が、16.4モーラであることを示しました。
標準区切り数 = 全モーラ数 ÷ 16.4
で、少数以下は切り捨ての整数で判定します。「あなた」の標準区切り数は、
標準区切り数 = 37 ÷ 16.4 = 2.256
から、2つです。一致率は、
区切り数一致率 = 実際の区切り数 ÷ 標準区切り数
区切り数一致率 = 1 ÷ 2 = 0.5
区切レートは、区切り位置一致率と区切り数一致率の平均ですから、
区切レート = (1.0 + 0.5) ÷ 2 = 0.75
となりました。
速度の判定
ブログ「テンポ/適正な速度」で、一拍すなわち単一モーラの時間幅が、0.129秒であると推定できましたから、あなたの単一モーラ時間が判れば、その比率から早い・遅いが判定できます。
一拍の時間を算出
ブログ「テンポ/モーラ数と区切り数で標準速度の比較」で検討した測定者の単一モーラあたりの時間Tmを求める式を使います。
発話が、文として語られた場合、その文の所要時間、発話モーラ数等から、測定者の発話の1拍すなわち1モーラの時間Tmは、
Tm = (Ts - Es) ÷ (Ms + Ds)
テンポサンプルでは、
TS=5.93秒Ms=37Ds=1Es=0.7
Tm = (5.93-0.7) ÷ (37+ 1) = 0.138秒
速度レート(0.0~1.0)を算出
標準の単一モーラ時間(SM)と、あなたの単一モーラ時間(YM)の比較から、
SM≧YMの場合、 速度レート = YM/SM
SM<YMの場合、速度レート= 2-YM/SM
で求めます。遅すぎても、早すぎても適切な速度と呼べませんので、不足分、過剰分を表す計算にしています。今回のケースは、SM<YMですので、
速度レート = 2 - 0.138/0.129 = 0.933
です。
テンポランク(0~5)
テンポランク = (0.75 + 0.933) ÷ 2 × 5 = 4.208
この料理は~大きいこの料理は~厄介だ
原文)この料理は、東京に昔からあるもるものだが、大きいのでちょっと厄介である。
声の艶
声の艶ランク= (倍音比率ランク+中間値ランク)÷2
倍音比率ランク
倍音比率= 倍音数÷(倍音数+非倍音数)
男性: 0.1833~0.3853 、女性: 0.1908~0.7279
♂倍音比率ランク=(2.4745×倍音比率+0.0465)×5
♀倍音比率ランク= (0.9309×倍音比率+0.3223)×5
で求めます。
中間値ランク
男性:0.4078~0.8652、女性:0.6364~0.9402
♂中間値ランク= (1.0931×中間値+0.0542)×5♀中間値ランク= (1.6459×中間値-0.5475)×5
声の艶ランク(0~5)
声の艶ランク = (倍音比率ランク+中間値ランク)÷ 2 = 3.5
AI信頼度
AI信頼度ランク = (C - 0.75) ÷ (0.95 - 0.75) × 5
AI信頼度ランク(0~5)
AI信頼度ランク = (0.94 - 0.75) ÷ (0.95 - 0.75) ×5 = 4.75
5つ星判定と声年齢
5つ星
声年齢
- SFFランク
- 滑舌ランク
- 抑揚ランク
- テンポランク
- 声の艶ランク
SFFランク
声年齢の推定
声年齢ランク = (SFFランク+滑舌ランク+抑揚ランク+テンポランク+声の艶ランク)÷5
操作用の釦
次へ: | ドリルを次へ進める。 |
---|---|
詳細: | 滑舌・抑揚・テンポ各評価の詳細表示です。ブログ「計測結果の詳細」参照方。 |
グラフ: | 滑舌・抑揚・強弱・声の艶をグラフ表示、音声で同時再生します。 ブログ「グラフで音程・強弱比較」参照方。 |
終了: | 音声ドリル診断を終了し、総合判定を表示する。 |
戻る: | 現在表示中の音声レーダーをキャンセルし、再度同じ行のドリルを実行する。 |
詳細表示サンプル
計測結果の詳細表示 |
総合判定サンプル
今回使用したドリルサンプルは、北大路魯山人作「甘鯛の姿焼き」冒頭部の5つの文です。総合判定は、この5つの文のスコアーからの平均です。文毎でバラツキがありますが、全文を纏めると実際の実力がより反映されると思います。![]() |
総合判定における詳細情報 |
コメント
0 件のコメント :
コメントを投稿