C++プログラミング
オンラインでコンパイル・実行できるサイト
正規表現
https://regex101.com/ : 正規表現でどうグループ化したものが対応しているかがわかるサイト
なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ
正規表現でここまでできるのかということと,住所の取り扱いの面倒さがわかるサイト
一般論
プログラミング基礎 (Python)
https://pythontutor.com/ : どのように実行されているか視覚的に見ることができるサイト
統計量
J. Matejka and G. Fitzmaurice, Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (CHI '17), 1290–1294, (2017). https://doi.org/10.1145/3025453.3025912 (動画: https://www.youtube.com/watch?v=DbJyPELmhJc)
異なるデータ分布でも同じ平均値になる場合があります.2次元データでもそのようなことがある(平均・分散・相関係数が同じだけど違うデータ分布),という例をこの文献では紹介しています.
コンピュータ基礎
C++でのデータ型の範囲 https://learn.microsoft.com/ja-jp/cpp/cpp/data-type-ranges?view=msvc-170
扱う数字の大きさに注意が必要
int型では国の予算案114.4兆円は扱えない https://www.mof.go.jp/zaisei/financial-structure/index.html
文字表現
もじばけらった : 文字化けを元に戻したいときに便利
キャラ名に「ソ」をいれるとバグる! 古参開発者「うっ……頭の中で何かが……」 : 『たとえば「ソフト」(835C 8374 8367)というテキストの場合、「5C」の部分がエスケープ文字と解釈されて「ャtト」(8383 74 8367)などと文字化けすることがあります。プログラムによってはクラッシュしたりするかもしれません。』
データ圧縮
誤り検出
運転免許証に記載されている12桁の番号について,右から2番目の数字はチェックデジットと呼ばれるもので,左10桁の数字の誤り検出をするための値になっています. 運転免許証の番号の形式及び内容について
誤り訂正