02_SEOで狙える大手企業がいないキーワードを自動で収集+結果を書き出そう

難易度
初級
ステータス
習得完了
開始日
2021/05/02
終了日
2021/05/03

Pythonによるブラウザ自動操作①


notion image
ポイント これは本当にPythonならではというコードミスをしました。 大文字にし忘れるだけで、エラーになるから要注意です。 大文字小文字で意味を変えてくれるのは本当に親切な機能ですが、動画を見ながらコードを打っていくときはひとつずつに注意(または答えのコードを参照する)せねば、なんでエラーになったかわからなくなります💦
 
いよいよ本格的な実践٩( 'ω' )و
 
このDay5からDay22までをちゃんと理解すると自分でコーディングできる力がかなり身につくと言っても過言ではないので難しいところがあっても質問をしながらしっかりとついてきて下さいね。
すごくやる気の出る言葉をおっしゃってくださいます。
ぼくのやりたかった実践的なプログラミングはここで築かれていくでしょう。
 
 

04. seleniumでGoogleのトップページを開く

notion image
ポイント エラーが出ても慌てず落ち着いて、英語をよく読んでみよう。 エラーリストを用意していると、対処がしやすいよ。
ここからいよいよコードをしっかり写経します。
動画で解説してくれるコードをどんどん打ち込んでいきます。
ここで☝️のポイントのところです。
Python特有だと思いますが、大文字小文字の問題でエラーが出る出る。ひとつずつ答えのコードと照らし合わせました。
 
僕はVBAとかJavaとかにちょっと経験がありますが、Pythonのように大文字小文字の意味わけはなかった世界なので、コードを書いてる時は全部小文字にすることが多かったです。ここらへんは改めないといけないところだと実感しました。
 

05.seleniumを使ってGoogleから特定キーワードで検索する

notion image
ポイント すごい、いきなり実践です。 seleniumをつかって数行書くともうこんなことができるのか、とPythonのポテンシャルに脱帽です。達成感がすごく出ます。
Google Chromeが開いて、自分が指定した検索ワードで検索かけてくれました!!
ここから次の処理に走るのが楽しみです!!
notion image
 

Pythonによるブラウザ自動操作②

notion image
ポイント ファイルオープンのやり方が学べます。 1行ずつ読み込んで、改行コード消して、リスト化するのが2行で書けちゃいます。 VBAだと10行くらい書きそう
Printしたらちゃんとリストに取得できていました。
Python
notion image
 

Pythonによるブラウザ自動操作③

 
notion image
ポイント データの収集に欠かせない正規表現 慣れていない状態だととても難しく感じます。とりあえず手段を学んでおいて、必要となったタイミングで正規表現チェッカーを触りながら学習してみようと思います。
 
とてもためになる正規表現一覧
Pythonの正規表現ではじめに覚えるべき3大パターン
Pythonのプログラムを書く時のテクニックとして、正規表現という文字列の表現方法があります。 正規表現を使うと、特定のパターンを持つ文字列を一般的に表現することができます。 この正規表現を使えば、ある特定の文字列を文章の中から見つけたりする時に便利です。 正規表現は一度理解してしまえばとても便利に使えるので、絶対に覚えておいて損はありません。 わかりやすい例として、郵便番号について考えてみます。 郵便番号は000-0000のように、3ケタの数→ハイフン→4ケタの数というパターンですね。これをプログラム言語で書こうとすると、0〜999の数字→ハイフン→0〜9999の数字...などと書かなければいけなくて意外と面倒です。 正規表現は文字列のパターンを記号で表す文字列になります。 その正規表現の特殊文字のことを メタ文字 と言います。 具体的には*とか、+とか、?みたいなものです。 はじめは基本中の基本、よく使う位置・回数・内容 3パターンの正規表現のメタ文字だけ覚えておけばOKです。 位置を表現できる正規表現です。 パターンを繰り返す回数を表す正規表現です。 例 abc* は ab, abc, abcc, abccccなどを表します。 ab+cは abc, abbc, abbbcなどを表します。 ac?dは ad, acd を表します。 ab{3}は abbb を表します。 文字列の内容を表す正規表現です。 例 a.c は abc, a1c, azcなどを表します。abbcは一致しません。 [a13bd] は a, 1, 3, b, dのうちのいずれか1文字を表します。 a\d@ は a3@, a5@, a0@ などを表します。 ac\wd は acZd, ac1d, acwdなどを表します。 任意の長さの文字列、例えばa1>354などを表す正規表現は .* や .+ です。 .*や.+ は任意の長さの文字列にマッチしますが、どちらも最長一致です。 最長一致はできるだけ最長となるようにマッチするという意味です。 具体例をあげた方が分かりやすいので具体例を挙げます。 例えば、 abx23 今日の天気 は晴れです。 という文字列があった場合、 や にマッチさせる正規表現として や  が考えられそうですが、実際には を使うと .*?
 
正規表現チェッカーもお役立ちとしてつかえる。
つかいやすいツールが無料で使える世の中だなぁ。
 
 

Pythonによるブラウザ自動操作④

notion image
ポイント いよいよ一回じゃ覚えられません。 動いているプログラムを1行ずつ見直す時間は必要だと思います。 今はただ「こんな動きをするのか」と見ていくだけで良いかと思います。 if domain in domains: これだけでオブジェクトをグルグル回す文章が書けるとか、やはりPythonはすごい
 
raw文字列のつかい方など、多くのインプットができているが、つかいこなせるか不安
Python
 
Python
 
 

プログラムを関数化してみよう

notion image
ポイント 多言語でプログラム書いている人なら容易です。 関数、引数などのお話です。
 
どうにかプログラムが動いてくれました。
まだまだ理解できていない記述もたくさんありますので、1行ずつ内容を復習していきます。
 
これで「町中華」がまだSEO弱めなところなどがチェックできます^^
結果.txt
町中華で飲ろうぜ 面白い 町中華で飲ろうぜ ベビースター 町中華で飲ろうぜ 曲 町中華で飲ろうぜ 高田秋 町中華で飲ろうぜ インスタ 町中華で飲ろうぜ コースター 町中華 チャーハン 町中華 東京 食べログ 町中華 チャーハン レシピ 町中華 チャーハンの素 町中華 チャーハンの素 口コミ 町中華 チャーハン 作り方 町中華 チャーハン 調味料 町中華 チャーハン 味付け
 
 
 
 
さぁ、Google Sheetsへの書き込みとスクレイピングですね。どちらも興味おおありなので、楽しみです٩( 'ω' )و
👇をクリックしてください!