Shiro Matsumoto

Writing / Notes

Writing

Articles, notes, and external posts in English and Japanese. This page is designed for mixed-language publishing without requiring every item to be translated.

Medium

Author page
Medium EN

Understanding the Skewed Word Distribution in ChatGPT-Generated Texts

A thought experiment on why ChatGPT-generated documents may show skewed word choices, using tokenization and embedding-space hypotheses.

Medium EN

Enhancing Monte Carlo Dropout

An exploration of uncertainty estimation in deep learning, extending Monte Carlo dropout with heteroscedastic loss.

Medium EN

Two OODs, Out of Domain and Out of Distribution

A clarification of two often-confused machine-learning concepts: out-of-domain data and out-of-distribution data.

Medium EN

Quantile Loss in Neural Networks

A practical note on using quantile loss when point predictions are not enough, especially in business forecasting contexts.

Medium EN

Mastering Modern Factor Analysis

A guide to modern factor analysis practice, with attention to software defaults and older conventions that can mislead interpretation.

Medium EN

How to use R on Google colaboratory

A short how-to for running R on Google Colab without relying on extra browser extensions or complex setup.

Medium EN

Understand the capabilities of cyclic encoding

An experiment showing how cyclic encoding can represent periodic patterns, and where one-hot encoding may still be useful.

Medium EN

Multicollinearity understood with the simplest example

A visual, minimal example explaining how multicollinearity can distort regression coefficients and interpretation.

Medium EN

Kotani’s Ant Problem: Simple but counterintuitive mystery

A geometry puzzle about the farthest point on a cuboid surface, used to show how intuition can fail in simple-looking problems.

Medium EN

Common Misuses of Statistical Hypothesis Testing: Part 3

A discussion of why small p-values should not be treated as direct evidence of practical importance.

note JA

「大雨警報」は4時間で消え、「なだれ注意報」は2か月居座る

気象庁の警報・注意報データを1年分集計し、種類ごとの継続時間や季節性、地域差を読み解いた分析記事。

note JA

TOEFL Speaking新形式の Listen & Repeat を練習できる無料サイトを作りました

2026形式の TOEFL Speaking に向けて作成した無料練習サイトの背景、機能、使い方を紹介。

note JA

Ankiで「知ってる単語をとても先に飛ばす」設定

Anki の共有デッキ学習で、既知語を効率よく後回しにして未知語へ集中するための設定メモ。

note JA

その有意差に意味はある?仮説検定のよくある勘違い

統計的仮説検定、とくに全数調査に対する有意差判断の誤用を、実務者向けに解説。

note JA

2年間の天気予報データの分析(晴れのち曇り、等の天気)

蓄積した気象庁天気予報データから、天気表現のパターンや地域・季節の傾向を分析。

note JA

2年間の天気予報データの分析(降水確率と信頼度)

過去の天気予報データを使い、降水確率と週間予報の信頼度にどのような傾向があるかを整理。

note JA

Qiita利用規約の落とし穴

エンジニア向け投稿サービスの利用規約を読み、投稿者が注意すべき権利面のポイントを考察。