ITの隊長のブログ

ITの隊長のブログです。Pythonを使って仕事しています。最近は機械学習をさわりはじめたお(^ω^ = ^ω^)

Presto

Prestoでランダムサンプリング

あるのかなー?ってググったらあった。すごい。 Data Sampling In Prestoragrawal.wordpress.com FROM dataset TABLESAMPLE BERNOULLI(25) テーブル名のあとに↑のように指定すると25%のデータがランダムサンプリングされて取得できる

Prestoでのgroupbyとdistinctの挙動

qiita.com 全然理解していなかった。上を参考に後日追加する。