<< 2016/11 >>
01 02 03 04 05
06 07 08 09 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

RSS

佐佐木信綱編『和歌名所めぐり』四国5 祖谷渓2016年11月17日

祖谷のかずら橋

祖谷のかずら橋(徳島県三好市)

補録

祖谷渓 い や だに

徳島県三好市。吉野川の支流祖谷川に沿って続く急峻な渓谷。かずら橋で名高い。土讃線阿波池田駅より四国交通バスが利用できる。

 

小杉榲邨おんそん

かづら橋わたりて思へば深淵に命をかくるところなりけり

(作者は阿波国出身の国学者。名は「すぎむら」ともよまれる。『古事類苑』編纂。明治十年歿)

OCRで誤認識されやすい字(追加)2016年11月22日

スキャナやOCR(Optical character recognition:光学文字認識)ソフトの進歩で、紙の文書の電子化も容易になってきた。私も日常の仕事で活用しているが、電子書籍を作る場合にも用いることがある。
最近の活字文書を読み取るのであれば、精度99パーセント以上を達成していると思われるソフトもある。それでも校正は必要で、誤認識を人の目でカバーしてやらなければならないのが現状だ。
同様の作業をしている人の参考にもなるかと、活字本からOCRソフトで電子テキストを作成する時、誤認識されやすい字を集めてみた(暫定版です)。
私は用途に合わせ幾つかのソフトを使い分けているが、主力として使っているのはパナソニックの「読取革命Ver.15」。読み取りの対象は、終戦後間もない頃の古本なども含む(戦前の本となると、精度はぐんと落ち、おおかた手入力の方が早いと思う)。
左の列がもとの字で、右の列が誤変換された結果の字。もちろん逆の場合も起り得ます。
(特に見逃しやすいと思われる組合せのあとにを付けました。)

○漢字 全体的な形が似たものの誤認識
目 日(横棒を一本見落す。以下同様の例が幾つもある)
自 白
東 束
昨 咋
間 問 
鳥 烏 
鳥 島 
人 入 
于 子
干 手(若干を若手に誤るなど)
千 干
宇 字
未 末 
曰 日
吊 弔
員 具
歌 耿

○漢字 偏・冠・繞などの誤認識
堀 掘(土偏と手偏は誤りやすい)
待 侍(行人偏と人偏。他例多し)
薄 簿(草冠と竹冠も誤りやすい)
鉱 絋
惜 借(立心偏と人偏。次の例も同様)
悼 倬
挽 悗(手偏を立心偏に誤る)
社 杜(示偏を木偏に誤る)
蟬 嬋(蟬は印刷標準字であり旧字ではないのに、蝉という俗字に換えてしまうことも多い。)
蛾 娥
廠 厰(厰は廠の異体字)
嘩 曄喧嘩が喧曄になっていたりすると見落としやすい)
昧 味三昧が三味になっていたり、曖昧が曖味になっていたり)

○漢字 旁などの誤認識
伸 仲
蚊 蛟(蛟はミズチ。想像上の生き物)
紋 絞 
鳴 嗚旁が鳥と烏の違い。嗚は嗚咽おえつ嗚呼ああくらいでしか遣われない語。)
啞 唖(「ろうあ」は聾啞と書くのが正式。啞をわざわざ異体字の唖に変換してしまう)
縁 緑 
候 侯気候が気侯に、侯爵が候爵になっていたり。要注意)
帥 師(元帥などは注意が必要)
酒 洒逆に瀟洒が瀟酒になっていたり。要注意)
遺 遣
棚 柵
打 扛(ハネを横棒と誤る)
噛 嚼
風 凰
雪 雲 
震 雲 
靄 露 
屛 屏(屏は異体字で、正式な字は屛なのに、屛を屏に変換してしまう)
衝 衙
式 弍
匂 句
句 旬
襞 襲
嘗 甞(甞は嘗の異体字)
雞 難(雞は鶏の異体字。現在は殆ど使われない)
動 勣

○片仮名
エ ヱ
ゲ グ
シ ツ
ン ツ
ソ ン特に誤認識が多い)
チ テ
ラ ヲ

○片仮名と平仮名(当然ながら似た形が多い)
ウ う
ヘ へ前者が片仮名、後者が平仮名。最も判別困難!)
モ も
リ り
レ し

○片仮名と漢字(片仮名には似た漢字が多く、特に注意が必要)
エ 工右は漢字の工(こう)
オ 才
カ 力右は漢字の力(ちから)
タ 夕右は漢字の夕(ゆう)
ト 卜右は漢字の卜(ぼく)
ニ 二右は漢数字の二)
ハ 八右は漢数字の八)
ミ 三
ロ 口右は漢字の口(くち)

○平仮名
き さ
か が(「き」「く」「こ」などはまず濁音と誤認識しないのに、「か」と「け」は時々誤認識する)
け げ(活字によって右側の「ナ」の部分のハネが強いので濁点と誤りやすいらしい)
け は
げ ば
は に(稀にある)
ば ぱ(濁点と半濁点の誤りは多い。ば行音すべてに当てはまる)
ば ぼ

○追加(2017.1.5、1.28、6.1)
風 虱
高 咼
雨 兩
爾 爽
雁 匯
橅 撫
蟠 幡
茣 莫 (茣蓙などは辞書登録されていないのだろうか。莫蓙にしてしまうことあり。)
殿 毆
隈 隕
鷹 縻
蕈 草
沿 洽
卿 喞
拠 抛 「拠(よ)る」が「抛(ほう)る」になってしまったりする。)
噛 喘
遺 遣
句 旬
品 晶
体 休
活 恬
覚 党
截 裁
哲 晢
春 眷
集 梟
譬 臂
鱏 鱆(エイがタコに)
巨 亘
来 束
潮 懶
黙 獣
餌 餅
束 朿
恒 怛
裏 裹 (裹は「裹(つつ)む」などと使う語)
速 達
鷲 鵞
影 彭
昔 音 
因 囚 

こうして並べてみると、校正・校閲がいかに精確な日本語の知識と厳密な注意力を要求される仕事か、改めて痛感せずにはいない。

紅葉に初雪2016年11月24日

鎌倉でも朝から雨が雪に変わり、盛りを前にした楓の紅葉などが雪をかむった。記憶に無い、早い初雪だ。

鎌倉市二階堂 紅葉に雪

鎌倉市二階堂 紅葉に雪


佐佐木信綱編『和歌名所めぐり』四国6 寒霞渓2016年11月26日

寒霞渓

寒霞渓(小豆島)

瀬戸内海の一島、小豆島にあり。

 

武井大助

神かけの紅葉が渓をわれ行けばわれももみぢぬこぬれ吹く風に

ふもと田のおくて刈りほす処女らに神懸おろし寒く吹くかな

高橋刀畔

小豆島島の藁屋の屋根草の青きにけぶる春の雨かな

補録 小豆島

神戸・姫路・新岡山・宇野などから船便がある。小豆島本島は淡路島に次ぐ瀬戸内海第二の大きな島。古くは「あづき島」と呼ばれた。島のほとんどが山地で、星ヶ城山(標高817m)は瀬戸内海最高峰である。他に紅葉の名所寒霞渓のある神懸山(標高671m)などがある。壺井栄の『二十四の瞳』の舞台としても名高い。

 

明治天皇

ふりつづく雨の音きけばあづき島霧こめし日もおもほゆるかな

植松寿樹

海にたつ昼靄ぬちの遠きやま備前とも云へり播磨とも云へり

岡井隆

雨雲の小豆島より一ときの灰黄として海あらはれ

佐佐木信綱編『和歌名所めぐり』四国7 屋島2016年11月28日

屋島より瀬戸内海を望む(うどん県旅ネット)

屋島より夕暮の瀬戸内海を望む

屋島

高松より近し、源平二氏の古戦場。(注:瀬戸内海に突き出たかたちの溶岩台地。かつては島であったが、塩田開発や埋め立てなどにより現在は陸続きとなっている。ことでん志度線の琴電屋島駅などが利用できる)

 

武井大助

屋島山夕かたまけて我立てば壇の浦に月のてる見ゆ

注:この「壇の浦」は下関のでなく屋島の壇の浦(檀ノ浦)。庵治あじ半島との間の入江で、那須与一の故事で名高い。

屋島より帰るさ
青木彰

真夏日のきらら波路の帆はらみて屋島山かげいや遠ざかる

補録

平家屋島落留事
平知盛(平家物語延慶本)

住み馴れし都の方は余所よそながら袖に波越す磯の松風

屋島八月十五夜
平行盛(源平盛衰記)

君すめばこれも雲井の月なれど猶恋しきは都なりけり

平福百穂

島山を吹きあげとほるさ夜あらし一ときにしてもとの静けさ

大井広

うつくしく灯る屋島のを見つつ船はゆくりなくくらき海原

佐佐木信綱編『和歌名所めぐり』四国8 五剣山2016年11月30日

八栗寺(うどん県旅ネット)

五剣山と八栗寺

補録

五剣山

香川県高松市。屋島の東。五剣山の名は、空海が五つの剣を奉納したからという。中腹に八栗寺やくりじがあり、修行場として名高い。ことでん志度線の八栗新道駅、JR高徳線の讃岐牟礼駅などが利用できる。

 

与謝野寛

五剣山岩の壁立ついただきに秋風のぼる青き海より

加藤増夫

歓喜天の線香のかをりただよへる八栗の秋の夕べとなりぬ

五剣山八栗寺の鐘は戦時供出し空しく十余年を経たり今ここに昭和卅年十一月竜瑞僧正新に之を鋳むとし余に歌を索む乃ち一首を詠じて之を聖観世音菩薩の宝前に捧ぐその歌に曰く

会津八一

わたつみ の そこ ゆく うを の ひれ に さへ ひびけ この かね のり の みため に