音声合成プログラムを作りる

1 ：07/06/14 ～最終レス：11/08/05: ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2 ：: じゃあ、一緒に作るれ
3 ：: しゃべた
4 ：: ネトラジリソース多いのんって誰かな
ＢＧＭとかあんまなくって、高音質なの
5 ：: よし、みんなで作れろ
6 ：: 中原小麦が多いるれ
7 ：: 音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する
と元国立理系大学院音声関係研究者の俺が言っておく。
8 ：: 音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。
9 ：: シミュレーションやるより、模型？を作った方が楽なんだなー
10 ：: でも、模型はメンテナンスが
11 ：: >>7 に期待
12 ：: いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。
ニュースとかで見聞きする合成音声ってみな糞でしょ？
何年も進化していないのよ。
音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。
13 ：: 　　　　　 |
　　＼　　__　　／
　　＿　（ｍ）　＿ﾋﾟｺｰﾝ
　　　　　|ミ|
　　／　｀´　＼
　　　　　('A`)　　　　　そうだ！　自分で喋ればいいんだ！
　　　　　ノヽノヽ
　　　　　　　くく
14 ：: >>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。
15 ：: まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな
16 ：: ツールならHTKにいいのがあるんじゃね？
音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな？
しかし懐かしすぎ・・・
17 ：: >>16
HTKおｋ、しらべる
ｔｈｘ
18 ：: 垚
19 ：: 1さんに期待
しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ
とか, ネットワーク屋さんのもれが曰ってみる
20 ：: ＨＴＫ登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声ｄｂ作成支援ツールでも作りる
ところで音声認識の分割精度てどれくらい出んの？
０から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな
21 ：: http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ！
22 ：: 86時間て正味？ネトラジから集めよう思たら数年分必要だなー
ところでこれＮＨＫの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん？
23 ：: http://pc11.2ch.net/test/read.cgi/software/1119069271/
24 ：: 理系大学院って工学部と理学部でだいぶ違うよな
25 ：: >>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな
26 ：: age
27 ：: age
28 ：: age
29 ：: ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

30 ：: 同じ金額で声優雇った方が早くね？
31 ：: >>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で２ちゃんログとかメールとか
読んでもらったら面白くなくね？
32 ：: 音（声）の切り張りと云うと、コナミがときメモ3でやってなかったっけ？
未プレイ（体験版触っただけ）だから、詳しくは解らんけど。
33 ：: イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。
34 ：: >>32
ときめも２と３でプレーヤの名前を呼んでくれる
ＥＶＳという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html
35 ：: "音声合成ゲーム"で検索すると
ＰＳ２　モジブリボンにＮＴＴ
ＰＳ２　ダビつく３に東芝
ＤＳ　お料理ナビは？
ＤＳ　日本史・世界史に日立
なんてのが見つかったよ
どうなん？
36 ：: >>33
イントネーションって網羅できるもんなの？
ＡｑｕｅｓＴａｌｋってあんまりきれいな声とは思えない
37 ：: 以前でてた音声コーパスっていうのがそういうものじゃないのか？
38 ：: 同じ単語でもどう使われるかでイントネーションって変わるからな。
39 ：: >>38
例えば？
40 ：: 彼氏↑、彼氏↓
41 ：: 箸　端　橋　嘴　波子　梯
頑張って聞き分けてください。
42 ：: 無理ッス絶対無理ッス自分無理ッス
43 ：: >>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。
44 ：: どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw
45 ：: >>35
くまうたも忘れないでくれ
46 ：: 早く作りろ
47 ：: 「あ」の波形と「い」の波形を足して２で割ったら、「あ」と「い」の中間の声ができるってわけか！
48 ：: ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン
49 ：: じゃ期限は明日の０時だ。よろしく。
50 ：: オーケーベイビー
首洗って待ってな。
51 ：: まだぁー？
もう全身洗って待ってるんだけど。
52 ：: 声帯って振動するだけ？声によって（高さじゃなく「あ」とか「い」）振動の仕方が異なることはないよね？
音が高くなると振動数が増えるだけだよね？
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの？
舌のシミュレーションが大変そう(><;)
53 ：: 音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。
54 ：: 必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ
55 ：: >>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ
56 ：: どっちかっつーと話者変換のほうに興味があるんだが
57 ：: その声優の音声ファイルはSNいいのか？
58 ：: >>56
話者変換って何に使うん？
自分のしゃべった声を誰かの声に似せるとかな？
59 ：: >>57
ＳＮは分かんねが、音は良さげ（６４ｋｂｐｓの４４ｋＨｚ）
一人しゃべりでＢＧＭなしなんじょ

60 ：: BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。
61 ：: 俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい
62 ：: エロゲの音声使えば？
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ
63 ：: 北都さんの声でお願いします
64 ：: 結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF
65 ：: >>64
藤田咲はまなストのモモ役が良かったなぁ
66 ：: ときめも２以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて
67 ：: >>66
overlap add
68 ：: ――
学校
￣￣￣＼
専門学校
69 ：: >>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい
70 ：: Alice Project
71 ：: 2007/12/19(Wed.) ◆ Julius-4.0 リリース
72 ：: 初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。
そんな、俺に、お勧めはこれ。
「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1
73 ：: 音声合成というより、台詞合成だな
74 ：: >>72
ワロタ
75 ：: れこーどうえーぶ
http://recwav.dip.jp/
音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222
76 ：: この板の住人じゃないんだけどＡｑｕｅｓＴａｌｋでwav保存できるソフト
あるのかな？
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしｗ
77 ：: 全二十じゃないの？
78 ：: 全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば？ということかな？
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。
79 ：: 普通に、ライン出力を録画するんではダメなのか？
80 ：: >>78
スマンスマンｗ
二十って書いたの俺かもｗ
81 ：: >>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか？
ほとんどの人がライセンスがないから試せないと思われ。
82 ：: >>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない
83 ：: 全二重に温室関係案のカナ？
84 ：: いまどこまで進んでいるんだ？
85 ：: age
86 ：: >>1
おーい！いまどこまで進んでいるんだ？
87 ：: age
88 ：: 「あ」の波形と「う」の波形を足して２で割ったら「い」の波形ができるのを発見して特許取った
89 ：: 特許番号は？
90 ：: どのくらい「い」と区別が付かないんだ？
不自然感０？
91 ：: じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん
92 ：: >>88-91
もうちょっとでアヘ声が実現するな
93 ：: >>88　特許番号は？
94 ：: juliusで音素列を指定して、
強制アライメント取れますか？
95 ：: >>94
つ単語・音素セグメンテーションキット＆Julian
96 ：: >>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか？
97 ：: Ｃ＋＋ＭＩＤＩプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう
98 ：: ヤフオクの方が売れるんじゃね？
99 ：: とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが
100read 1read
1read 100read TOP カテ一覧スレ一覧削除依頼 ▲ ・　次のスレ どうせ暇だしFirefoxのアドオン作るわ 【魔法】リリカル☆Lisp【言語】 【ガジェット】Gadgets プログラミング【Vista】 【えっ】Perlに未来はあるのか？【終わり？】