【python×openpyxl】エクセルデータから「辞書のリスト」形式にする。

使いどころは少ないと思いますが、エクセル(xlsx)形式から「辞書のリスト」形式で取得する関数を作ったので備忘録として残します。「辞書のリスト」形式とはこのような形式です。 このようなエクセルファイル「エクセルデータ.x … “【python×openpyxl】エクセルデータから「辞書のリスト」形式にする。”の続きを読む

【python3×selenium】ヤフーオークションにpythonで自動ログインしてみよう。

【python3×selenium】ヤフーオークションにpythonでログインしてみよう。

前回はRMSの自動ログインについて紹介しましたが、今回はpython3でseleniumを使ってヤフーオークションに自動ログインするコードを紹介します。スクレイピングの基本的な内容が分かっていれば理解できるはずです。※g … “【python3×selenium】ヤフーオークションにpythonで自動ログインしてみよう。”の続きを読む

[python3] 住所データをざっくり3分割してみた。

という住所があったとします。これを簡単に住所・番地・建物名にする方法を考えたので備忘録として残します。 住所の判定は左から順番にチェックしてアラビア数字があるところまでとします。次にそこから[‘1&#8242 … “[python3] 住所データをざっくり3分割してみた。”の続きを読む

【python3×selenium】FireFoxブラウザでUA偽装してスクレイピングする。

FireFoxブラウザでUA偽装してスクレイピングしよう

今回はFireFoxのUAを変更してアクセスするプログラムを備忘録として残しておきます。 ■まずユーザーエージェントとは? WEBブラウザがサーバーにアクセスするときにブラウザの種類(FireFox等)OSの種類(Win … “【python3×selenium】FireFoxブラウザでUA偽装してスクレイピングする。”の続きを読む

【python3】どの実行環境でも相対パスでフォルダを指定する。

どの実行環境でも相対パスでフォルダを指定する。

どのPCで実行しても同じフォルダの操作を行うのであれば相対パスを指定しなければいけません。そこで簡単に相対パスでフォルダを指定する方法を備忘録として残します。 このように実行ファイルのパスを確認することが出来ます。これを … “【python3】どの実行環境でも相対パスでフォルダを指定する。”の続きを読む

【python3】ファイル名に使えない文字列は事前に変換しておく。

標準ライブラリのosモジュールを使ってファイル生成を自動でしていて、ファイル名・フォルダ名で使用できない文字列で作成しようとするともちろんエラーになります。そこでファイル名がランダムになる場合は、正規表現モジュールreを … “【python3】ファイル名に使えない文字列は事前に変換しておく。”の続きを読む

【python3】文字を半角に統一する。

【python3】文字を半角に統一する。

データの処理やスクレイピングをしているとアルファベットや数字が全角だったり半角だったりで困る事が良くあります。こういう時はエラーを防ぐ為にも、全て半角に変更するよりを挟みましょう。 このように半角英数に変換されました。全 … “【python3】文字を半角に統一する。”の続きを読む

【python3】csvやtxtをエクスポートすると「UnicodeEncodeError: ‘shift_jis’ codec can’t encode character ‘\uff0d’ in position 209: illegal multibyte sequence」エラーが出る。

pythonでcsvやtxtをエクスポートするとエラーが出る。

Pythonでcsvやtxtをエクスポートする時によく「UnicodeEncodeError: ‘shift_jis’ codec can’t encode character&#82 … “【python3】csvやtxtをエクスポートすると「UnicodeEncodeError: ‘shift_jis’ codec can’t encode character ‘\uff0d’ in position 209: illegal multibyte sequence」エラーが出る。”の続きを読む

【python】Selenium WebDriverderプロセスまで終了させる。

【python3】webdriverのプロセスまで終了させる。

「python Selenium WebDriverder」でスクレイピングしているとWebDriverderのプロセスが残り続けてメモリを使い続けてしまっていることがあるのでその対策を紹介します。 WebDriverd … “【python】Selenium WebDriverderプロセスまで終了させる。”の続きを読む

リストAからリストBに含まれないリストを作る。

リストAからリストBに含まれないリストを作る。

リストAからリストBに含まれないリストを作るには集合型に変換行い差をとる方法のご紹介です。 set型は重複しない要素を集めたもので和集合、積集合、差集合の集合演算を行う事ができる。 この差集合を取ることで となる。 最後 … “リストAからリストBに含まれないリストを作る。”の続きを読む