_
select
repository_language,
count(distinct(repository_url)) as active_repos_by_url,
YEAR(created_at) as year,
QUARTER(created_at) as quarter,
from [githubarchive:github.timeline]
where
type="PushEvent"
group by
repository_language,
year,
quarter
order by
repository_language,
year DESC,
quarter DESC
githubarchive:github.timeline
のスキーマのtype
にStar的なやつがなかったので見れなかった。githubarchive:github.timeline
は249,308,569
のRowがあって、サイズは154GBもあるんだそうだ。それがものの10s程度で解析できるのでBigQueryスゲーなとおもいます。