音声処理ソフトを作りたいんだけどプログラミングに詳しい人助けて

未分類
1:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

wavファイルの音声データってどういう形で収納されてるの?
wavファイルのフォーマットは出てくるんだけど肝心の音声データの部分は波形データが収納されてるくらいの説明しかでてこなくて
波形データがどういうものなのかがよくわからなかった



2:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO

サンプリングとか量子化ビット数とか調べろ


3:なんJゴッドがお送りします2022/04/01(金) ID:EaOzrXZm0USO

最も単純な形式だから時刻と音の強さの配列じゃないの


5:なんJゴッドがお送りします2022/04/01(金) ID:lZOElD5q0USO

そこからの知識で音声処理に手を出そうとしてるのか・・・


6:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO

あとステレオだと1サンプルずつ左右交互に配置される


9:なんJゴッドがお送りします2022/04/01(金) ID:+rWBbMVP0USO

超早口で入ってるからゆっくり再生使え


18:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO

詳しい人助けて(俺の代わりに作って)って意味だと解釈した
やる気ないなら糞して寝ろ


19:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>18
なんでそんなわけのわからん解釈をするのか・・・


20:なんJゴッドがお送りします2022/04/01(金) ID:qLOx7+100USO

煽るわけじゃないけど、これ読んで理解できないならいろいろアレだぞ

PCMであれば、8ビット長または16ビット長
ステレオであれば、L R L R L R … の順で交互に時間順に記録
16ビットの数値は、リトルエンディアン
データ
8ビットPCMは、unsigned char (0 ~ 255、無音は 128)
16ビットPCMは、signed short (-32768 ~ +32767、無音は 0)


21:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>20
お前が俺の質問の意味を理解できてないってことはわかった


25:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

1が阿呆すぎて辛い


26:なんJゴッドがお送りします2022/04/01(金) ID:IASVpX4e0USO

バカだこいつw
波形データにフォーマットもクソもねえよ
音そのものが波形なんだよバーカ


28:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>26
PCで処理するのに音がそのまま保存されるわけねえだろ
全部数字に変換されてるんだよ


27:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

画像がRGBの各ピクセルの羅列だってのは知ってますか


29:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>27
知ってるけど


33:なんJゴッドがお送りします2022/04/01(金) ID:O8pOZ4tj0USO

fmtチャンクに書かれている


36:なんJゴッドがお送りします2022/04/01(金) ID:J6qULIar0USO

ある周波数ほにゃららHZのデータを仕込むときには具体的にどういうバイナリをデータチャンクに入れるのかみたいなのが知りたいんだろ?


38:なんJゴッドがお送りします2022/04/01(金) ID:+VjAbcFG0USO

テキストファイルみたいになってると思ってるってこと?


45:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>38
なってないファイルがあるとしたらそれは量子コンピュータだからノーベル賞貰えるぞ

>>39
その数値の単位は?


39:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

瞬間瞬間の圧力の数値を並べただけのものがいわゆる波形データなので画像の1ピクセルに相当するのは一つのFloat値かShort値
フォーマットもクソもないただの配列
数値が並んでるだけ
解釈すべき速度だけがサンプリングレートとして別に記録されてる
これで分からなければ無理


42:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

強いて言うならバイナリ状態の配列
cならfreadとかで読め



43:なんJゴッドがお送りします2022/04/01(金) ID:0wKDTBVs0USO

言ったろ
こいつ学ぶ気なんかさらさらないよ


44:なんJゴッドがお送りします2022/04/01(金) ID:O8pOZ4tj0USO

パルス変調符号のことが多い


48:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

あの
まずお前はプログラム上でバイナリファイル開いたことすらないだろ
そっからやり直して
普通は出てこないような阿呆な質問してるから


57:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

強いて言うなら
何らかのセンサーで測定できる負の圧力の最大値をshort型の負の最大値
正の圧力の最大値をshort型の正の最大値に対応させた仮の単位
ということになる
例えば各最大値を交互に取るような波形を再生すると爆音が鳴って死ぬ
これでわかるか?


71:なんJゴッドがお送りします2022/04/01(金) ID:dxp/8KfT0USO

本当に >>57 の説明を読んで >>62 で理解したのか怪しいと思うが強制的に終わらせた感w


60:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

多分何デシベルとかいう実際の単位に対応した値が入ってると思い込んでたんだろ?
頼むそうであってくれ


66:なんJゴッドがお送りします2022/04/01(金) ID:K8wJZ3bx0USO

求めてる答えは知ってるがお前の態度が気に食わない


69:なんJゴッドがお送りします2022/04/01(金) ID:rFbwG8kj0USO

そういうライブラリ使えよ
ずいぶん昔にDirectSound使って波形編集アプリ作ったわ
もう忘れたがな


70:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

疎密波の概念とかサンプリング定理とか
講義で聞くと要らんだろそこの説明とか思ってたけど
要るやつには要るんだな


77:なんJゴッドがお送りします2022/04/01(金) ID:dxp/8KfT0USO

音声ってものは電気的には時間とともに変化する電圧の値でしかない
それを一定の周波数でサンプルするってことは1個ずつは電圧に応じたただの1つの値でしかない
これはフォーマットの問題じゃなくて音声データのしくみそのものの話だから
フォーマットに絡める限り出てくる答えじゃない


79:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

>>77
だから>>1でフォーマットの中身の音声データの中身を聞いたじゃん


78:なんJゴッドがお送りします2022/04/01(金) ID:TWnRhne10USO

質問の意図を理解できてなくてずれたことをグダグダ言ってたくせに
解決後もぐだぐだと管巻いてる奴みっともなさすぎ


82:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

普通にやってたら疑問に思わないことだから
気持ちが先行して実力以上のことやろうとしちゃったんだろ
基礎って大事なんだなって


83:なんJゴッドがお送りします2022/04/01(金) ID:S+RgchOc0USO

しかし画像のピクセルの輝度については自然に最小値から最大値までの線形って解釈してるはずなのに
音波に関して何らかの単位に沿ってるはずって思い込んだのは何でなんだろな


86:なんJゴッドがお送りします2022/04/01(金) ID:+RdEqXtH0USO

質問の仕方が糞すぎて草


87:なんJゴッドがお送りします2022/04/01(金) ID:eI8vYWA50USO

データヘッダーの構造やチャンク構造の話じゃないの?


89:なんJゴッドがお送りします2022/04/01(金) ID:o1+guU+u0USO

>>87
オーディオ情報のデジタル表現の話らしいよ
俺たちはデルタシグマの話でもしようず


88:なんJゴッドがお送りします2022/04/01(金) ID:zP0OG6kw0USO

仕様書くらいあるやろ


91:なんJゴッドがお送りします2022/04/01(金) ID:lZOElD5q0USO

音って波形じゃなくて空気の粗密波だよ




元スレ:https://mi.5ch.net/test/read.cgi/news4vip/1648746232
未分類