Pythonでフォームに入力したURLからページタイトルを取得したいんやが

未分類
1:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

調べたらBeautifulSoup 使えばできるんやがスクレイピングは怖い
なんかいい方法ないか



2:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

スクレイピングは制約多いしなんか大げさな気がしている


3:なんJゴッドがお送りします2023/02/18(土) ID:8ycmeGKU0

chatGPTに頼めよ


4:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>3
BeautifulSoup 進められた


5:なんJゴッドがお送りします2023/02/18(土) ID:ztSIHPry0

aiに聞けよ


6:なんJゴッドがお送りします2023/02/18(土) ID:yezkyeSe0

全部aiに聞けばコードも出す


7:なんJゴッドがお送りします2023/02/18(土) ID:AlB3Hnkaa

タイトル教えてくれるサイトあるぞ


9:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>7
そういう感じの機能を自分で実装したい


8:なんJゴッドがお送りします2023/02/18(土) ID:ehVCKEl20

urllibでできんか?


11:なんJゴッドがお送りします2023/02/18(土) ID:KjoWWvTpd

AIに逆らうなよアホ


12:なんJゴッドがお送りします2023/02/18(土) ID:yhX6cCi5H

ページにアクセスしてタイトル取ったらええやん


13:なんJゴッドがお送りします2023/02/18(土) ID:AqhsI1AI0

任意のWebページのタイトルを取得するってスクレイピングそのものなんだからどんなやり方としてもそれはつまりスクレイピングだぞ


17:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>13
そうなん?
URLを入力したらページタイトルを取得してリストにしてくれる機能作りたいんやがこういう使い方で迷惑かかるやろか


14:なんJゴッドがお送りします2023/02/18(土) ID:CjdlJg3Ma

BeautifulSoup使ってスクレイピングしかないやろ…


15:なんJゴッドがお送りします2023/02/18(土) ID:2KsCIi6h0

スクレイピングの何が怖いんや
短時間に大量のアクセスしたりしなければ普通の閲覧となんら変わらんやろ


19:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>15
気にせなあかんこと多いやん


16:なんJゴッドがお送りします2023/02/18(土) ID:AnKv7LfPa

いやそのリンクにアクセスしないとtitle要素を取得できないんだからスクレイピングするしかないだろ


18:なんJゴッドがお送りします2023/02/18(土) ID:TjUbL2Lj0

ページタイトルとかrequestsでhtmlダウンロードして読ませるだけやろ
スクレイピングの手前や


20:なんJゴッドがお送りします2023/02/18(土) ID:WMVwGSv8a

賢い奴はchatGPTに質問するプログラム組むよ


21:なんJゴッドがお送りします2023/02/18(土) ID:qfnN96Po0

Pythonあんまり触ったことないがSeleniumのスクレイピングは簡単だったぞ


22:なんJゴッドがお送りします2023/02/18(土) ID:CjdlJg3Ma

利用規約見てスクレイピングのこと書いてないかよーく読んだらええ
一秒待てばええやろの精神や
あーあとrobots.txt見てみるの面白いよな


25:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>22
その辺がよくわからんから怖いんよ


23:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

request とurllibどっちがええんやろ


24:なんJゴッドがお送りします2023/02/18(土) ID:TjUbL2Lj0

何回も高速に繰り返し取得するならアカンけど1個だけなら人がやってるのと変わら


26:なんJゴッドがお送りします2023/02/18(土) ID:O55YO6RH0

requestsかurllibでええやんけtitleタグとるだけやろ


27:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

chatGPT 様はurllibを勧めてきた


29:なんJゴッドがお送りします2023/02/18(土) ID:H9hiF5gja

BingAIに聞け


30:なんJゴッドがお送りします2023/02/18(土) ID:R2fyjYeO0

html読み込まないといけないんだから結局スクレイピングなんやないん?


32:なんJゴッドがお送りします2023/02/18(土) ID:BQvLheZ60

学校の課題とかなんか?
車輪の再発明になりそうやけども


33:なんJゴッドがお送りします2023/02/18(土) ID:nIcVMiDr0

>>32
いや個人で作ってるだけ




元スレ:https://nova.5ch.net/test/read.cgi/livegalileo/1676700258
未分類