ITの隊長のブログ

ITの隊長のブログです。Pythonを使って仕事しています。最近は機械学習をさわりはじめたお(^ω^ = ^ω^)

2018-10-08から1日間の記事一覧

bs4でscript,style,commentタグを除去する

from bs4 import BeautifulSoup, Comment def preprocessing(soup): # コメントタグの除去 for comment in soup(text=lambda x: isinstance(x, Comment)): comment.extract() # scriptタグの除去 for script in soup.find_all('script', src=False): script.…

アウトドア用のSNS?「The dyrt」

thedyrt.com 英語読めないからはっきりとはわからんが、キャンプ地のレビューだったり、なにかポイントためたりすることができるっぽい。こんなサービスもあるのね ビジネスモデルってなんじゃろと調べているがよくわからん。これ英語勉強する必要があるな。…

TF-IDFを理解しようと頑張った

先月ぐらいから自然言語処理頑張ろうとして入門っぽいTF-IDFをPythonから理解しようとしたけど使いどころわからんくて無事死亡。 今日は式から理解しようとしてやってみた。 対数がわからん やさしく学ぶ 機械学習を理解するための数学のきほん ~アヤノ&ミオ…