ソフトウェアの開発者にとって日本語は最悪の言語です。デジタル・トランスフォーメーションというマーケティング用語をつくる前に、私たちは社名や住所を正規化しないといけない。正規化されていないデータ管理のコストはきわめて高い。
あなたも戸籍、住民票、住民基本台帳、年金、健康保険、マイナンバー制度のごちゃごちゃしたシステムに一度はいらついて、机を思いきり蹴りとばしたと思う。行政がデータの正規化という概念を理解していれば、何兆円という税金はいらなかった。
話を戻して、今回は会社名の正規化について考えます。この記事は「データの正規化」というシリーズの最初になりますが、このシリーズはすべて感情的に書かれています。よっぽどの理由がないかぎり読まないでください。読ませる意図はもとより、理解してもらう希望は最初からありません。
このシリーズでは
クソ
という単語が何百回も出てきます。子どもは読まないでください。
名前と株式会社の間にスペースを入れる
会社名はまず名前と株式会社をわける。例えば
三菱商事株式会社
は
三菱商事 株式会社
とする。データを管理する担当者は三菱商事と株式会社の間に半角スペースを 1 つだけ入れて、表示するときに変えたり変えなかったりしよう。保存と表示をわけるのはデータ管理の大原則です。三菱商事と株式会社の間にスペースが入ることを許さないブーマーには「三菱商事株式会社」と表示し、それ以外では「三菱商事 株式会社」と表示する。
「なんでそんなことをするんだ! どう違うっていうんだ!」
とコンピューターを触ったこともない中年のおっさんは舌打ちするかもしれない。三菱商事と株式会社は違う概念で、三菱商事株式会社の名前は三菱商事で、株式会社は三菱商事が入っているグループ名。人にたとえるなら、三菱商事は太郎、株式会社は山田。山田太郎と山田と太郎は違うが、山田太郎と書いたら
山田太 郎
山田 太郎
山 田太郎
なのかわからない。
「いや三菱商事株式会社は誰が見ても
三菱商事 株式会社
ってわかるだろう!」
と市役所に勤めている引退間近のクソブーマーは思うかもしれない。今あなたも三菱商事株式会社を見たときに
三菱商事 株式会社
と変換したはず。あなたの脳みそは三菱商事と株式会社の間に見えない境界を入れました。「入れていない!」という人は嘘つきクソ野郎です。
断言すると、99.99999% の日本人は
三菱商事 株式会社
と読む。だったら最初からスペースを空けろって話です。わざわざ難しく表記する必要がどこにあるのか? そんなものはない。難しくするのはクソバカがやることです。データ管理の鉄則を知らない職員はレターパックの荷造りだけをやっていればいい。
データ管理の鉄則
データはクソバカでもわかるように管理する
三菱商事株式会社を連続して読んでしまうバカはコンピューターです。コンピューターは恐ろしいバカなので、三菱商事と株式会社の間にスペースを入れないと、コンピューターはそれが株式会社なのかわからない。
「いや、株式会社はどう考えてもわかるだろ!」
と反感をもったクソプログラマーは変な名前にたまたま遭遇していないだけ。例えば株式会社以外に合同会社や合資会社がある。そして組合、投資組合といった概念がある。そこで
合同会社農業連携BG投資組合1号
という名前の会社ができる。この会社は実在します。この会社は
合同会社 農業連携BG投資組合1号
と切りますが、投資組合の一種なので
合同会社 農業連携BG 投資組合 1号
が最も妥当な読み方になります。複数のグループ(この場合は合同会社、投資組合)に属する名前は管理が大変です。次の組合も実在する。
Sapphire 1 Partners 有限責任事業組合
有限責任事業組合は日本では法人格をもたない。合同会社農業連携BG投資組合1号は名前だけを見ると組合に見えなくもない。組合という言葉がついていたら組合と識別する…というゴミのような管理をとったら、合同会社農業連携BG投資組合1号はSapphire 1 Partners 有限責任事業組合と同じ組合になってしまう、かもしれない。
「合同会社という名前がついているから合同会社とすぐわかるっ!」という意見は話にならない。むしろ小学校に帰れという話です。私たちの認識はコンピューターに通じない。
実際、ほとんどの人は有限責任事業組合が一つの連なった名前だとわからない。あなたも有限責任事業組合を
有限責任 事業組合
と切って読みませんでしたか? Sapphire 1 Partners 有限責任事業組合は
Sapphire 1 Partners 有限責任 事業組合
と読んでしまう人もたくさんいるはず。だったら最初から、株式会社も合同会社も有限責任事業組合も半角のスペースを入れたらいい。
株式会社は誰が見てもわかるからスペースを入れず、組合はわかりにくいから入れるという犬のクソにも劣る判断をする人がいます。そうしたルールの例外をつくるとデータがめちゃくちゃになり、コストがどんどん高くなる。
「それはデータを使うお前の脳みそがお花畑なだけ」
と偉そうなプログラマーと熟練事務職員は思うかもしれない。
「どんな表記でも適切に処理するのが大人の仕事だろう? 違うか? このアンポンタン」
と思う人もきっといる…が、そういう人にこう言いたいのです。
できることと簡単にできることは違う
できます。私はこの記事に反感をもつ人の 99.999% よりデータを処理できます。この記事の主張は「データ管理のコストをわざわざ高くするてめえのクソみてえな風習をてめえのクソと一緒にてめえのクソトイレに流せ、クソが」という話です。
「直流電源だっていいじゃん、交流電源もいいけど、直流電源のほうがシンプルでいいじゃん、直流電源でまちづくりをしよう!」
なんていうクソバカがどの世界にいるか? 進歩に規格はつきもので「規格はいらない! 今は JSON という形式でなんでもデータベースに入るんだ!」とクソみたいなことを言うフロントエンドエンジニアはテクノロジーの意味をまるで理解していない。
「データの規格などナンセンス。たかが株式会社に…」
という「たかが」の発想はネズミのクソです。「たかが」というクソ思考をもつ人は、すべてに「たかが」を適用します。残されるものは
クソの山
です。見てください、金融庁が残した会社データを。
「たかが住所」
「たかが改行」
「たかがアルファベット」
の結果、ゴミのクソ山ができました。文字どおりのクソだよ、クソが。
日本で最もデータをめちゃくちゃにする者は行政のおっさん、もしくはオバハンです。今や 2022 年なのに Windows 98 を使っている(のかは知らんが、古いシステムを使っているだろう)眠たげ春うららなおっさん(もしくはオバハン)どもです。こいつらは行政の資料と統計をちぐはぐなルールでつくる。
行政へ:
つべこべ言わずスペースをあけて正規化しろ
クソが
次は会社名のアルファベット表記と住所の正規化です。続く。