【画像】北九州市長候補「住所の表記揺れを修正するプログラム?2時間で作れらぁ!」

スポンサードリンク
超オススメ↓






スポンサードリンク

【画像】北九州市長候補「住所の表記揺れを修正するプログラム?2時間で作れらぁ!」

2E662A27-1D19-4A64-86FF-F35ACD98F76F_4_5005_c


1: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:49:01.56 ID:DAb/pfhU0
no title

no title

no title




引用元: ・https://nova.5ch.net/test/read.cgi/livegalileo/1686131341/

閲覧注意!激ヤバ!本当に怖い話




2: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:50:11.88 ID:iN77tM5/0
ほな作ってください



4: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:51:08.77 ID:UOx7tgVt0
落選しとるやん



6: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:51:56.33 ID:4aN/X0OJ0
こういうバカが安請け合いして現場が大荒れするんやろな



7: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:52:49.30 ID:wH4x9Xjd0
漢数字一律変換とかしたら千葉が1000葉になるやん



8: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:53:24.20 ID:WVZj7dcyd
一般論やけど、イレギュラーが考えられてないシステムは無能やぞ
最近の政府が作るシステムが正にそれや



9: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:53:46.08 ID:ky4BVXWd0
表記揺れってまだ直せないのか



11: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:54:26.81 ID:t+lug3p8a
ほんで2時間で作れたん?



13: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:54:50.20 ID:IMOZnGrA0
エクセルだと
「千代田一丁目」「1番1号」
「千代田1丁目」「1-1」
「千代田」「1丁目1−1」
「千代田」「1-1-1」

こんな感じでそもそもセルの区切るところすら違ってるんやぞ



22: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:57:29.68 ID:kuLqmZyd0
>>13
一番下ので統一してほしいわ



14: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:55:23.63 ID:GBIZbjZMa
一切文字打たせずシステムで決めた値を選ばせる形式以外揺れるわな



15: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:55:28.56 ID:IJ0Lqg940
記事読んだらあまりに複雑で驚いた



16: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:55:32.66 ID:u4iAXCz50
どうでもええけど、住所入力するときに全角入力しか認めなくて
2を2にせんといかんかったり-をーにする必要あるのほんま嫌い



72: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:13:19.56 ID:rclfSh+xd
>>16
A棟のAは全半角の違いがわかりやすいけどBは判別むずいわ



154: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:45:16.18 ID:5618SlyU0
>>16
銀行系多いよな
ぶっ飛ばしたくなるわ





18: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:56:37.04 ID:Io5dZAYx0
エンジニアやけど正直これ引用してドヤ顔してるイキリエンジニアも大概きついわ



19: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:56:40.43 ID:Twnh/6no0
置き換えた後間違いないか試験するのだるそう



20: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:56:48.79 ID:58FXxXP30
住所の表記揺れと名字の旧字体はあく統一しろ



26: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:58:43.75 ID:ZkVnmiZ3d
出来らあっ!



27: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:58:56.39 ID:pN5hDLmuH
文字コードとか全く知らなそう



29: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 18:59:47.95 ID:NZyQ3TGE0
どうせ外注に投げるんやろ



31: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:00:08.34 ID:LfymZ5dG0
大文字の拡張子を小文字にしようとして全部ぶっ飛ばしたとこなかったけ?



32: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:01:39.59 ID:Egs6YEC80
いくらお役所仕事でも流石に住所をExcelとかaccessで保管するのは不味そうやが



33: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:02:02.70 ID:xqvIaMA50
○丁目表記ないとこはどうなるんや



34: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:02:18.63 ID:2Z0bcCV3M
えっ
漢数字とローマ数字とアラビア数字が混在する住所をEXCELで!?



47: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:05:44.61 ID:a7wyIXFZa
>>34
弊社なら月末までに開発可能です😸



35: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:02:25.95 ID:xBTWMJm30
全角と半角が混在しててめちゃくちゃだよ



36: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:02:47.07 ID:h+mqE/K8a
地理情報系のエンジニアやがこの問題はマジで根深い
京都市のデータとかホンマ扱いたくない



46: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:05:25.13 ID:PZWO0KTB0
>>36
町名表記だったり交差点の東入ル西入ルだったり表記揺れどころの違いちゃうもんなあ



37: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:03:10.84 ID:OGPetzE60
Excelで何人分のデータ管理するつもりなんや



38: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:03:21.91 ID:OGmQUv6F0
なんで郵便番号作った時に住所まで特定させなかったんや?



40: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:03:51.68 ID:xBTWMJm30
戸籍から統一表記にしないと根本は解決しないな



41: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:04:33.71 ID:a7wyIXFZa
日本の住所表記揺れは数多すぎ
正規表現プログラム5-10年規模でのプロジェクトなんやっけか



43: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:04:49.92 ID:pN5hDLmuH
Excelなら検索できるし楽勝じゃんとでも思ってそう



48: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:05:52.39 ID:wLNxdTcJ0
住居表示と地番が違う問題もどうにかして欲しい



53: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:06:50.82 ID:ANRIkQUXd
こいつがほんとに2時間で作ったら国政選挙出た時票入れてやるよ



54: 以下、ニュー速クオリティでお送りします 2023/06/07(水) 19:06:55.86 ID:HTl/8Ge60
無理に決まってるやん
素人でもわかるぞ







  


この記事へのコメント

1.  Posted by  名無しクオリティ   投稿日:2023年06月08日 17:31

プリン嫌い

2.  Posted by  プリン嫌い   投稿日:2023年06月08日 17:36

AIに任せるのは面白いけど、検証が大変だよ

3.  Posted by  名無しクオリティ   投稿日:2023年06月08日 17:43

そもそも入力フォームを統一すればいいのにアホだよね
先見性のないクズの仕事の後始末は大変よね

4.  Posted by  名無しクオリティ   投稿日:2023年06月08日 17:55

郵便番号を64ケタぐらいにしてあげたら?

5.  Posted by  名無し   投稿日:2023年06月08日 17:57

素朴な疑問なんだけど郵便局はどうやって吸収してんの?
配達員が苦労してるだけ?

6.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:01

住居表示と法務局上の地番のずれを解消しないといけないし、合併地番の問題もある。
下手に現住所いじったら免許証の書き換え問題も発生するだろうし、戸籍の附票を全部訂正する必要もある。
一番混乱するのは市役所だろうね。

7.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:02

今タイに住んでるけど、こっちだと住所にタイ語使うなとか数字はタイの文字でとか一切なくてどっちでも使える(俺が使っている民間のサービスや銀行や行政の窓口の範囲でだが)
日本語固有の問題なのか?それともITが無能なのか?

8.  Posted by  名無し   投稿日:2023年06月08日 18:05

「Excelでええやん」が叩かれてるんでなくて、思い付きで語ってる変換方法がガバガバだから叩かれてるんだが

9.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:08

北9州市

10.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:11

若い頃に老害とか言って批判する若い人は
歳取ったら話が通じないいわゆる老害みたいな人になるよね
相手の立場になってものを考えないからなんだろね

11.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:16

>>5
入力側と処理側でルールが決まってれば対応はできる
郵便は入力を半自動で行い対応できないものを人間が修正

入力に制約をかけるか、全パターンを網羅した正規置換の予算あれば可能
逆に言うとこの方式は例外が生まれるたび対応が必要
河野は自然学習AIなら個別に修正しなくても対応できるというレベルの話をしている
Excelでもできるというのは網羅性の事を考慮していないので、話のレイヤーが違う

12.  Posted by  名無し   投稿日:2023年06月08日 18:19

エクセルで置換すりゃええやん思うだろうけどバイトで雇ったり中国に多重受けさせるとエクセル何それな奴らが集まるんやで?
そんで元請はデータなんて見みも触りもしないし下に流す奴らはその下と同じで営業がマージンかすめてるだけだから同じようにデータなんて見もしない
更に多重請負いで仕事もらった現場管理者も端金で働いてるのに良い仕事しようと身を削ってデータ精査するかと言えばまずしない

13.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:23

表記ゆれ如きはAWKでちょいスクリプト書けば終わるレベルなので、これを自慢するものでもないなあと

14.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:24

※5
配達員は『配達順と配達先苗字をセットで覚えて』配達してる。
住所は番地までの詳細は覚えない。
『次の配達先が郵便物に記載あるから、ここの番地はこれなんだろうな』程度の気持ち。

住所だけでモノが届くと思っている人達は現実ははかなり人力であることを知った方がいい

15.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:25

なんかねえ、普通に正規表現で該当箇所を一定の書式に変更すればええんやで
そんなの一々説明せんでも分かるやろ

16.  Posted by  名無し   投稿日:2023年06月08日 18:26

もうそんなもん存在するわ

17.  Posted by  名無し   投稿日:2023年06月08日 18:27

何でいちいちExcelに展開すんねんと思ってるプログラマもいそう

18.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:36

例に上がった問題だけでも2時間で完璧に対応するのは無理な上
あらゆるパターンの表記ゆれが無数に存在しているという…
エンジニアなら絶対関わりたくない案件だと思う

19.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:39

※14
そもそも老人は結構番地までは書くけど
そこから先は省略しやがるからなぁ

20.  Posted by  名無し   投稿日:2023年06月08日 18:39

どんなスクリプト組んだところで一般人の表記パターンに追い付くことはないだろ
どんな教育受けてきたんだとか言うのがオチ

21.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:42

対処しても対処しても例外が見つかり続けるだろうな

22.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:42

数字以外の住所なんて有限なんだから、選択式にすればいいのでは?
下手に入力させるから面倒になる

23.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:45

この前の町村合併とかでもそうだけど、未だに古い住所名が使われる場合があるしなぁ

24.  Posted by  名無し   投稿日:2023年06月08日 18:47

これは恥ずかしい

25.  Posted by  名無し   投稿日:2023年06月08日 18:51

将来的にじゃなくて今そうなってますならスゲーのに

26.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:55

車検証の住所コードあるだろ?何年も前から。
コードの数列入れたら何条何丁目何の何まで自動で出力されて揺らぎもへったくれもないやつ。
あれで統一しろ。安上りだろ。

27.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:56

市町村までは文字でそれ以下は全部数字で処理すればいい

28.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:56

元ネタの杉原何某ってツイたどったらゴミみたいな反ワク情弱じゃねえかw こんなアホの言うことを真に受けるほうがどうかしてる。

29.  Posted by  名無し   投稿日:2023年06月08日 18:56

>>3
手書き禁止で住所コードのみ受け付けるくらいにせんとムリだぞ

30.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:57

番地一つ取っても
・番地がない
・「無番地」と書いてある
・ABC
・甲乙丙
・仁義礼智信
・渡辺
みたいにやりたい放題だからな
どうせ数字の全角半角、漢数字かアラビア数字の揺れ程度だと思ってるんだろうけど

31.  Posted by  名無し   投稿日:2023年06月08日 18:57

住所振り直したら?

32.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:58

流石にAIを使ってってところは「は?」って思ったけど、住所の名寄せはそんな簡単な話ではない

33.  Posted by  名無しクオリティ   投稿日:2023年06月08日 18:59

もう一律全角数字をまずやめたらどうだろうか?それならすぐに変換できるでしょ。
漢数字は、、難しいよなあ。実際には置換できんし、チェックは人間がやることになるからヒューマンエラーが必ず出る。

34.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:01

10000人の職員が一億件チェックしたとして、一人10000件か。地獄だなこれw

35.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:02

技術的な知識がないだけで批判しすぎだろ
教えてやればいいんだよ、河野太郎なら採用して導入するだろう

36.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:02

複雑ではあるけど、この人が正しくて実際やろうと思えばすぐできるぞ。全体の99%は問題ないレベルのはすぐ出来るから少数のマイナー事例はフィードバックで反映すりゃいいし。現状だって1%どころかもっと多くがまともに動いてないんだから

37.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:06

昔みたいに固定電話が各家庭にあれば電話番号と名前からなんとかなった可能性ある?

38.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:09

郵便番号で番地手前までは統一でいけるとして、問題はそっからだよな。二丁目1321とか漢字と数字が混じってたりするし半角と全角とか‐いれるやつと入れない奴とかマンション名も多種多様。号室も漢字のやつもいれば部屋の名前とかで区切られたりする。エクセルの関数がどうとかで何とかなる話ではない

39.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:10

8かと思ったらBだった!

40.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:29

>>36
あなたが思いついて実行できると考えていることは
なぜ実行されていないのでしょうか
その理由について思いを馳せる方が、有意義な知見が得られるでしょう

41.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:30

>>36
すぐ出来るのなら、誰もこんな非難してないんだよなあ。
じゃあお前がやったらどうだ?大金持ちになれるぞw

42.  Posted by  名無しクオリティ   投稿日:2023年06月08日 19:34

これを簡単にできるって言っちゃう方がエアプのデジタル音痴だろ

43.  Posted by  名無し   投稿日:2023年06月08日 19:53

>軽い気持ちで適当なツイートしたら炎上してしまって通知とまらない。。

プロのエンジニアの皆さんの感情を逆撫でしてしまって申し訳ないです。毎秒リツイートきて読むこともできないのでここで一括して謝ります。

あとはもうキミらが好きに、死ぬまで追い込めば?

44.  Posted by  名無しクオリティ   投稿日:2023年06月08日 20:55

俺と同じ学年で全国1位の成績だった奴がグーグルに入って日本語の表記揺れの問題に何年も取り組んでるわ
2時間で解決できるなら本当の天才だわ

45.  Posted by  名無しクオリティ   投稿日:2023年06月08日 20:59

確かにエクセルなら難しいし自分には出来んけど、普通にプログラム組めば現実的な作業時間で補完できると思う。
基本はコイツの言う通りの置換がメインになるが、事前の置換対象を決める過程でイレギュラーの抽出を繰り返すことになるから、
最終的にどうしても自動処理できないと判断されたデータは個別で手動対応することになる。
元データがDBにどんなカラム構造で保存してあろうと、XMLでもCSVでもJSONでも、フォーマットも文字コードも何の問題にもならないし、使用言語も何でも構わない。全然難しいことじゃない。

46.  Posted by  名無しクオリティ   投稿日:2023年06月08日 21:09

2時間でできるとか偉そうなこと吹いてないで、2時間でできました!ってコード公開した方が支持されると思うよ

47.  Posted by  名無し   投稿日:2023年06月08日 21:13

>>7
新旧漢字かなカナ数字漢数字入り乱れるのが可能な日本固有かも

48.  Posted by  名無しクオリティ   投稿日:2023年06月09日 00:30

たぶんなー、座標で一から定義しなおす方が早い可能性もある。

49.  Posted by  名無しクオリティ   投稿日:2023年06月09日 07:33

住所の細かいところって現場の人知で何とかしてる部分あるよね

50.  Posted by  名無し   投稿日:2023年06月11日 20:11

そこら辺のエンジニアでもそのコード書けって言われたら半日でできるよ。マジで。

コメントの投稿