1read 100read
2011年10月1期プログラム音声合成プログラムを作りる TOP カテ一覧 スレ一覧 削除依頼
・ 次のスレ
どうせ暇だしFirefoxのアドオン作るわ
【魔法】リリカル☆Lisp【言語】
【ガジェット】Gadgets プログラミング【Vista】
【えっ】Perlに未来はあるのか?【終わり?】


音声合成プログラムを作りる


1 :07/06/14 〜 最終レス :11/08/05
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2 :
じゃあ、一緒に作るれ

3 :
しゃべた

4 :
ネトラジリソース多いのんって誰かな
BGMとかあんまなくって、高音質なの

5 :
よし、みんなで作れろ

6 :
中原小麦が多いるれ

7 :
音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する
と元国立理系大学院音声関係研究者の俺が言っておく。

8 :
音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。

9 :
シミュレーションやるより、模型?を作った方が楽なんだなー

10 :
でも、模型はメンテナンスが

11 :
>>7 に期待

12 :
いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。
ニュースとかで見聞きする合成音声ってみな糞でしょ?
何年も進化していないのよ。
音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。

13 :
       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
    /  `´  \
     ('A`)     そうだ! 自分で喋ればいいんだ!
     ノヽノヽ
       くく

14 :
>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。

15 :
まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな

16 :
ツールならHTKにいいのがあるんじゃね?
音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな?
しかし懐かしすぎ・・・

17 :
>>16
HTKおk、しらべる
thx

18 :

19 :
1さんに期待
しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ
とか, ネットワーク屋さんのもれが曰ってみる

20 :
HTK登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声db作成支援ツールでも作りる
ところで音声認識の分割精度てどれくらい出んの?
0から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな

21 :
http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ!

22 :
86時間て正味?ネトラジから集めよう思たら数年分必要だなー
ところでこれNHKの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん?

23 :
http://pc11.2ch.net/test/read.cgi/software/1119069271/

24 :
理系大学院って工学部と理学部でだいぶ違うよな

25 :
>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな

26 :
age

27 :
age

28 :
age

29 :
ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

30 :
同じ金額で声優雇った方が早くね?

31 :
>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で2ちゃんログとかメールとか
読んでもらったら面白くなくね?

32 :
音(声)の切り張りと云うと、コナミがときメモ3でやってなかったっけ?
未プレイ(体験版触っただけ)だから、詳しくは解らんけど。

33 :
イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。

34 :
>>32
ときめも2と3でプレーヤの名前を呼んでくれる
EVSという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html

35 :
"音声合成 ゲーム"で検索すると
PS2 モジブリボンにNTT
PS2 ダビつく3に東芝
DS お料理ナビは?
DS 日本史・世界史に日立
なんてのが見つかったよ
どうなん?

36 :
>>33
イントネーションって網羅できるもんなの?
AquesTalkってあんまりきれいな声とは思えない

37 :
以前でてた音声コーパスっていうのがそういうものじゃないのか?

38 :
同じ単語でもどう使われるかでイントネーションって変わるからな。

39 :
>>38
例えば?

40 :
彼氏↑、彼氏↓

41 :
箸 端 橋 嘴 波子 梯
頑張って聞き分けてください。

42 :
無理ッス絶対無理ッス自分無理ッス

43 :
>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。

44 :
どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw

45 :
>>35
くまうたも忘れないでくれ

46 :
早く作りろ

47 :
「あ」の波形と「い」の波形を足して2で割ったら、「あ」と「い」の中間の声ができるってわけか!

48 :
ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン

49 :
じゃ期限は明日の0時だ。よろしく。

50 :
オーケーベイビー
首洗って待ってな。

51 :
まだぁー?
もう全身洗って待ってるんだけど。

52 :
声帯って振動するだけ?声によって(高さじゃなく「あ」とか「い」)振動の仕方が異なることはないよね?
音が高くなると振動数が増えるだけだよね?
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの?
舌のシミュレーションが大変そう(><;)

53 :
音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。

54 :
必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ

55 :
>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ

56 :
どっちかっつーと話者変換のほうに興味があるんだが

57 :
その声優の音声ファイルはSNいいのか?

58 :
>>56
話者変換って何に使うん?
自分のしゃべった声を誰かの声に似せるとかな?

59 :
>>57
SNは分かんねが、音は良さげ(64kbpsの44kHz)
一人しゃべりでBGMなしなんじょ

60 :
BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。

61 :
俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい

62 :
エロゲの音声使えば?
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ

63 :
北都さんの声でお願いします

64 :
結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF

65 :
>>64
藤田咲はまなストのモモ役が良かったなぁ

66 :
ときめも2以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて

67 :
>>66
overlap add

68 :
――
学校
 ̄ ̄ ̄\
専門学校

69 :
>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい

70 :
Alice Project

71 :
2007/12/19(Wed.) ◆ Julius-4.0 リリース

72 :
初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。
そんな、俺に、お勧めはこれ。
「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1

73 :
音声合成というより、台詞合成だな

74 :
>>72
ワロタ

75 :
れこーどうえーぶ
http://recwav.dip.jp/
音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222

76 :
この板の住人じゃないんだけどAquesTalkでwav保存できるソフト
あるのかな?
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしw

77 :
全二十じゃないの?

78 :
全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば?ということかな?
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。

79 :
普通に、ライン出力を録画するんではダメなのか?

80 :
>>78
スマンスマンw
二十って書いたの俺かもw

81 :
>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか?
ほとんどの人がライセンスがないから試せないと思われ。

82 :
>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない

83 :
全二重に温室関係案のカナ?

84 :
いまどこまで進んでいるんだ?

85 :
age

86 :
>>1
おーい!いまどこまで進んでいるんだ?

87 :
age

88 :
「あ」の波形と「う」の波形を足して2で割ったら「い」の波形ができるのを発見して特許取った

89 :
特許番号は?

90 :
どのくらい 「い」 と区別が付かないんだ?
不自然感0?

91 :
じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん

92 :
>>88-91
もうちょっとでアヘ声が実現するな

93 :
>>88 特許番号は?

94 :
juliusで音素列を指定して、
強制アライメント取れますか?

95 :
>>94
つ 単語・音素セグメンテーションキット&Julian

96 :
>>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか?

97 :
C++MIDIプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう

98 :
ヤフオクの方が売れるんじゃね?

99 :
とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 削除依頼
・ 次のスレ
どうせ暇だしFirefoxのアドオン作るわ
【魔法】リリカル☆Lisp【言語】
【ガジェット】Gadgets プログラミング【Vista】
【えっ】Perlに未来はあるのか?【終わり?】