wavファイルの音声データってどういう形で収納されてるの?
wavファイルのフォーマットは出てくるんだけど肝心の音声データの部分は波形データが収納されてるくらいの説明しかでてこなくて
波形データがどういうものなのかがよくわからなかった
2:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO
サンプリングとか量子化ビット数とか調べろ
3:なんJゴッドがお送りします2022/04/01(金) ID:EaOzrXZm0USO
最も単純な形式だから時刻と音の強さの配列じゃないの
5:なんJゴッドがお送りします2022/04/01(金) ID:lZOElD5q0USO
そこからの知識で音声処理に手を出そうとしてるのか・・・
6:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO
あとステレオだと1サンプルずつ左右交互に配置される
9:なんJゴッドがお送りします2022/04/01(金) ID:+rWBbMVP0USO
超早口で入ってるからゆっくり再生使え
18:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO
詳しい人助けて(俺の代わりに作って)って意味だと解釈した
やる気ないなら糞して寝ろ
19:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
>>18
なんでそんなわけのわからん解釈をするのか・・・
20:なんJゴッドがお送りします2022/04/01(金) ID:qLOx7+100USO
煽るわけじゃないけど、これ読んで理解できないならいろいろアレだぞ
PCMであれば、8ビット長または16ビット長
ステレオであれば、L R L R L R … の順で交互に時間順に記録
16ビットの数値は、リトルエンディアン
データ
8ビットPCMは、unsigned char (0 ~ 255、無音は 128)
16ビットPCMは、signed short (-32768 ~ +32767、無音は 0)
21:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
>>20
お前が俺の質問の意味を理解できてないってことはわかった
25:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
1が阿呆すぎて辛い
26:なんJゴッドがお送りします2022/04/01(金) ID:IASVpX4e0USO
バカだこいつw
波形データにフォーマットもクソもねえよ
音そのものが波形なんだよバーカ
28:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
>>26
PCで処理するのに音がそのまま保存されるわけねえだろ
全部数字に変換されてるんだよ
27:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
画像がRGBの各ピクセルの羅列だってのは知ってますか
29:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
>>27
知ってるけど
33:なんJゴッドがお送りします2022/04/01(金) ID:O8pOZ4tj0USO
fmtチャンクに書かれている
36:なんJゴッドがお送りします2022/04/01(金) ID:J6qULIar0USO
ある周波数ほにゃららHZのデータを仕込むときには具体的にどういうバイナリをデータチャンクに入れるのかみたいなのが知りたいんだろ?
38:なんJゴッドがお送りします2022/04/01(金) ID:+VjAbcFG0USO
テキストファイルみたいになってると思ってるってこと?
45:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
39:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
瞬間瞬間の圧力の数値を並べただけのものがいわゆる波形データなので画像の1ピクセルに相当するのは一つのFloat値かShort値
フォーマットもクソもないただの配列
数値が並んでるだけ
解釈すべき速度だけがサンプリングレートとして別に記録されてる
これで分からなければ無理
42:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
強いて言うならバイナリ状態の配列
cならfreadとかで読め
43:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO
言ったろ
こいつ学ぶ気なんかさらさらないよ
44:なんJゴッドがお送りします2022/04/01(金) ID:O8pOZ4tj0USO
パルス変調符号のことが多い
48:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
あの
まずお前はプログラム上でバイナリファイル開いたことすらないだろ
そっからやり直して
普通は出てこないような阿呆な質問してるから
57:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
強いて言うなら
何らかのセンサーで測定できる負の圧力の最大値をshort型の負の最大値
正の圧力の最大値をshort型の正の最大値に対応させた仮の単位
ということになる
例えば各最大値を交互に取るような波形を再生すると爆音が鳴って死ぬ
これでわかるか?
71:なんJゴッドがお送りします2022/04/01(金) ID:dxp/8KfT0USO
本当に >>57 の説明を読んで >>62 で理解したのか怪しいと思うが強制的に終わらせた感w
60:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
多分何デシベルとかいう実際の単位に対応した値が入ってると思い込んでたんだろ?
頼むそうであってくれ
66:なんJゴッドがお送りします2022/04/01(金) ID:K8wJZ3bx0USO
求めてる答えは知ってるがお前の態度が気に食わない
69:なんJゴッドがお送りします2022/04/01(金) ID:rFbwG8kj0USO
そういうライブラリ使えよ
ずいぶん昔にDirectSound使って波形編集アプリ作ったわ
もう忘れたがな
70:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
疎密波の概念とかサンプリング定理とか
講義で聞くと要らんだろそこの説明とか思ってたけど
要るやつには要るんだな
77:なんJゴッドがお送りします2022/04/01(金) ID:dxp/8KfT0USO
音声ってものは電気的には時間とともに変化する電圧の値でしかない
それを一定の周波数でサンプルするってことは1個ずつは電圧に応じたただの1つの値でしかない
これはフォーマットの問題じゃなくて音声データのしくみそのものの話だから
フォーマットに絡める限り出てくる答えじゃない
79:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
>>77
だから>>1でフォーマットの中身の音声データの中身を聞いたじゃん
78:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO
質問の意図を理解できてなくてずれたことをグダグダ言ってたくせに
解決後もぐだぐだと管巻いてる奴みっともなさすぎ
82:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
普通にやってたら疑問に思わないことだから
気持ちが先行して実力以上のことやろうとしちゃったんだろ
基礎って大事なんだなって
83:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO
しかし画像のピクセルの輝度については自然に最小値から最大値までの線形って解釈してるはずなのに
音波に関して何らかの単位に沿ってるはずって思い込んだのは何でなんだろな
86:なんJゴッドがお送りします2022/04/01(金) ID:+RdEqXtH0USO
質問の仕方が糞すぎて草
87:なんJゴッドがお送りします2022/04/01(金) ID:eI8vYWA50USO
データヘッダーの構造やチャンク構造の話じゃないの?
89:なんJゴッドがお送りします2022/04/01(金) ID:o1+guU+u0USO
>>87
オーディオ情報のデジタル表現の話らしいよ
俺たちはデルタシグマの話でもしようず
88:なんJゴッドがお送りします2022/04/01(金) ID:zP0OG6kw0USO
仕様書くらいあるやろ
91:なんJゴッドがお送りします2022/04/01(金) ID:lZOElD5q0USO
音って波形じゃなくて空気の粗密波だよ
元スレ:https://mi.5ch.net/test/read.cgi/news4vip/1648746232