P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

旅は道連れ、世は情け

2020-04-29 | 番外編の番外編

ここまで未知語について集中的に記事を書いていたところなのですが、なかなか進捗が思わしくなくプチ書けない期に突入してしまったようです。
この下の2記事は流れをぶった切ってしまって申し訳ありませんが書きかけのアニソン記事がいい所まで煮詰まってきたのでついつい編集心が湧いてきてしまい、なんなら気分を変えてこの連休中に仕上げてしまおうとあさっての方向にやる気を出した結果、
ついにアニソン特集記事・番外編の編集が終わりました。
[第1弾]~[第5弾]アニソンゲーソン列挙 500曲
[第6弾]では非アニソンであるが関連曲 20曲  をおまけでつけて 計520曲どどーんとまとめてみましたよ。

別運営のブログからもリンクを貼りましたのでそこから来た訪問者の方はついでによければ日本語入力の記事も見ていってくださいね。

さて落ち着いたら接頭語接尾語のつく未知語の棚卸し作業に戻るんだ!いいな!---ここで一句、

何回も みたい芋だよ 誤変換

お粗末様でしたぁ!

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

[第6弾]アニカルと親和性/シナジーを感じる一般曲・股旅お蔭参り20景

2020-04-29 | 番外編

[第5弾]までで紹介したアニソンが通算500曲になりました。パチパチパチ…👏
ここからは蛇足ではありますが今のアニソンの隆盛があるのも日本音楽界のPOP職人の土壌があってこその文化で、恩返しという意味も込めて非アニソン曲をとりあげてみたいと思います。
昔からアイドルソングとかでも当時の最先端のクリエイターが楽曲提供をしてたりしてその音楽性を支えていたのは皆が知るところですよね。
ここでは現在のアニメ・マンガ・ゲームなどのサブカル分野がいかにして存立するのかその関連背景を追ってみたいと思います。
隣接や源流、メインカルチャーとのシナジーやネット流行動向などの諸状況の織りなす残香を感じ取りながら20曲の傑作を選びました。
アニソンという枠を取り払って広く捉えなおすとあなたのアニソン観に新たな化学反応が起こるかもしれません。
アニソン股旅・番外編はこれにて完結いたします。多謝!

 

1.Welcoming Morning/シングル/作詞・作曲・編曲 - pal@pop / コーラス - 川本真琴 / 歌 - Chappie
→現在のボーカロイド楽曲にも通じる曲構成といい、デザイン集団GROOVISIONSが開発した着せ替えキャラクターのコンセプトといい時代の20年先を行っていたと言っても過言ではない先進性がパッケージされた一曲。

2.乙女 パスタに感動/アルバム「All of タンポポ」他/作詞・作曲 - つんく / 編曲 - 永井ルイ / 歌 - タンポポ
→つんくプロデュースのモー娘。派生ユニット・タンポポの代表曲であるこの曲は、乙女のポリシーの作曲で知られる永井ルイ氏が編曲を担当。ブリティッシュロックテイストをふんだんに取り入れてアレンジされ極上のポップスに仕上がっている。

3.LIPS/アルバム「TROPICAL GREEN」/作詞 - 安次嶺希和子、児山啓介 / 作曲 - 安次嶺希和子、児山啓介 / 歌 -安次嶺希和子
→スマホゲームアプリ・グリムノーツのテーマ曲「忘れじの言の葉」がよく知られている安次嶺希和子(あしみねきわこ)。今回はエステハウスCMとしてタイアップされた「LIPS」を紹介する。キュートな一面が垣間見れます。

4.Climax Jump/仮面ライダー電王/作詞 - 藤林聖子 / 作曲・編曲 - 鳴瀬シュウヘイ / 歌 - AAA DEN-O form
→作詞家の藤林聖子は特撮ヒーローものの分野でもいかんなく実力を発揮している。同じく作曲家の鳴瀬シュウヘイも仮面ライダーシリーズへの楽曲提供が多い。もちろん両者ともアニメ関連楽曲分野での活躍は言わずもがなである。

5.ジェニーはご機嫌ななめ/シングル/作詞 - 沖山優司 / 作曲 - 近田春夫 / 編曲 - Juicy Fruits / 歌 - ジューシイ・フルーツ
→「萌え」「電波」「ピコピコ」三拍子揃ったこの曲は1980年にリリースされたものとは思えないほどのオタクソングの遥かなる源流をすでに確立している。その後Perfumeややくしまるえつこをはじめとする数々のアーティストにもカバーされている時代を超えた名曲。

6.パンと蜜をめしあがれ/アルバム他/作詞 - 原田郁子 / 作曲 - ミト / 編曲 - クラムボン / 歌 - クラムボン
→音楽性の広さとハイセンスな感性で精力的に活動するクラムボンのミトはアニメ関連楽曲提供も非常に多くおこなっている。そのルーツを感じさせるメジャーデビュー当初のヒット曲。

7.The Brave/勇者ヨシヒコと導かれし七人(第三章)/作詞・作曲 - 影山ヒロノブ / 編曲 - 鈴木マサキ、寺田志保 / 歌 - JAM Project
→勇者ヨシヒコシリーズの世界観を盛り上げるJAM Projectの熱い一曲。鳴り響くホーンも力強く、間奏のJAZZYな展開もオシャレでカッコいい。

8.STAY AWAY/アルバム「REAL」他/作詞 - hyde / 作曲 - tetsu / 編曲 - L'Arc〜en〜Ciel & Hajime Okano(岡野ハジメ) / 歌 - L'Arc〜en〜Ciel
→鋼の錬金術師アニメ・劇場版のテーマ曲を担当し海外でも広く知られる存在となったL'Arc〜en〜Ciel。それ以前の頃から日本のロックシーンの先頭を走っていたまさに白眉となる一曲。PVが圧巻である。

9.storia/歴史秘話ヒストリア/作詞・作曲・編曲 - 梶浦由記 / 歌 - Kalafina
→もともと歴史秘話ヒストリアのテーマ曲「Historia:opening theme」は言語不詳のいわゆる梶浦語であったが2013年以降から歌詞付きバージョンの「storia」がそれにとってかわり主題歌となった。

10.こころたび/「NHK-BS『にっぽん縦断こころ旅』オリジナルサウンドトラック」他/作詞・歌 - 池田綾子 / 作曲 - 平井真美子
→NHKアニメ電脳コイルのOP曲のイメージがアニソンファン的に記憶されるところだがBS・こころ旅のテーマ曲としてすっかり顔となった本曲ではボーカルの池田綾子が清涼感のある伸びやかな高音を聴かせてくれる。

11.まばたき/アルバム「TROPOPAUSE」他/作詞・作曲 - 佐藤泰司 / 編曲・歌 - THEATRE BROOK(シアターブルック)
→デュラララ!!OP曲・裏切りの夕焼けでアニソン界にも突如認知されるようになったTHEATRE BROOKであるが拙サイト運営者であるぴとてつは1997年リリースの「まばたき」のPVを当時の音楽番組「ミュージックトマトJAPAN」で観て印象に残っていた記憶がありこちらのイメージの方が強い。

12.青い地球はてのひら/アルバム「EXTRA BRIGHT」他/作詩・作曲・歌 - かの香織 / 編曲 - 屋敷豪太
→飯塚雅弓・坂本真綾・丹下桜・牧野由依・田中理恵ほかへの楽曲提供を幅広くこなしアニソン仕事も多いシンガーソングライターのかの香織は旅好きでも知られる。当時首都圏FM局でヘヴィー・ローテーションされた本曲はエアポートで聴きたくなるような世界を周遊する感覚を想起させる。

13.ハプニングス/アルバム「Liv la la la Luv」他/作詞・作曲・編曲 - 樫原伸彦 / 歌 - FLIP-FLAP
→ふしぎ星の☆ふたご姫のOP曲を歌ったFLIP-FLAPはアイドル歌謡の王道を行く良質のJ-POPも送り出している。楽曲提供の樫原伸彦はかつてアニメ金色のガッシュベル!!で使われるぼいんぼいーんな挿入歌「チチをもげ!」の作曲を手がけていたというのだからその振り幅の広さには驚きだ。

14.世界でいちばん頑張ってる君に/アルバム「Portable Tunes-Harco Cm Works-」他/作詞 - 山田英治 / 作曲・編曲 - 川嶋可能 / 歌 - HARCO
→HARCOが歌う"スズキアルト"のCMソング「世界でいちばん頑張ってる君に」。癒しのある楽曲の提供者・川嶋可能は映画聲の形のaiko楽曲の編曲で関わっているほか個人的にお気に入りのアニメ「あにゃまる探偵 キルミンずぅ」の劇伴も担当しておりそのほのぼのした作風には揺るぎがない。

15.ラッシュ・アワーのアダムとイヴ/アルバム「PRISM」/作詞・歌 - 谷村有美 / 作曲・編曲 - 西脇辰弥
→平成アニソン大賞に選出された珠玉の名曲「Agape」曲中でのやさしいハーモニカの演奏も披露している西脇辰弥はシンガーソングライター谷村有美の黄金期を彩った作曲家。バート・バカラック調のアレンジにのせて伸びのあるクリスタルボイスが印象深く、スケール感もある。

16.クラフト理論/アルバム「捺子頂上 」他/作詞・作曲・歌 - なっちゃんPEAK
→2005年avex tuneよりメジャーデビュー後、実質1年で解散してしまった幻のテクノポップユニットなっちゃんPEAK。作詞、作曲、編曲、プログラミング、シンセサイザー担当メンバーのPEAK(柳健太郎)はその後任天堂と関わりの深いHAL研究所サウンドチームに所属して(石坂健太郎として)大乱闘スマッシュブラザーズXなどの音作りに参加している。

17.ばぶるばす/アルバム「スーパーコンピレーションアルバム みんなのうた 音楽集」他/作詞・歌 - いはたじゅり / 作曲 - 松本俊明 / 編曲 - 渡部チェル
→ケロロ軍曹のOP曲でも知られるいはたじゅりはNHKみんなのうた「ばぶるばす」にも作詞・歌唱として参加している。作曲はMISIAの「Everything」を手がけた松本俊明。編曲はアニソン・一般曲等幅広く提供している渡部チェルと豪華な布陣で製作されている一曲。

18.Love+Piece+Ice Cream!/アルバム「Cute」/作詞・作曲 - Yuppa / 歌 - Hazel Nuts Chocolate
→ニコニコ動画にアイマス素材MADとしてこの曲が採り上げられアーティストHazel Nuts Chocolateの「へなちょこ」という愛称も定着した。可愛らしさとファンシーがお菓子のように溶け合った一曲。

19.Super Scooter Happy/アルバム「S.F. sound furniture」/ 作詞・作曲・編曲 - 中田ヤスタカ / 歌 - capsule
→中田ヤスタカサウンドにのせて軽快に流れるこの曲は「実態がよくわからない」というタイトルのひだまりスケッチMADで広く知られることになる。そのムービーはまさにプロの犯行とでもいうべきハイクオリティな構成と完成度でネット界を席巻した。

20.CANDY POP feat.SOUL'd OUT/アルバム「SUGAR SHINE」/作詞 - Heartsdales、SOUL'd OUT、VERBAL / 作曲 - SOUL'd OUT、VERBAL / 歌 - Heartsdales
→当時の熱量の高さをうかがわせるハルヒMADの鮮烈な映像に記憶に残る方も多い事だろう。"姉・妹ともに美人さん"なHeartsdalesと焼きたて!!ジャぱんのED曲も担当したSOUL'd OUTとのコラボ・ラップ・チューン。

 

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

[第5弾]股旅の賭場でアニソン切り札20点張り・取りこぼし回収

2020-04-29 | 番外編

これまでお馴染みのアニソン特集で数多の曲をとりあげてきました。
王道、ハイセンス、わちゃわちゃ、埋もれた名曲、鉄板曲、萌え&燃え、おしごと、コミカル、シリアス、鳴り物、オリエンタル、シンフォニック、ハロウィン風、病んでる、エキセントリック、ノスタルジー、漢気、スポーツ、青春、ミリタリー、ギャンブル、アート、グルメ、新旧硬軟、お祭り、猫。
さまざまありますが前回までであげきれなかった曲を20曲ほどすくい上げていきたいと思います。
アニソンアーティストであればアニメのタイアップの曲だけでなく、c/w曲やアルバムからの単体曲もあわせて探索してこれはというのを選んでみました。
もし自分的にティンとくるようなタイトルだと感じていただけたのでしたら、この機会に"履修"されていってはいかがでしょうか。
想像を超えた"プルスウルトラ"な名曲に出会えるかもしれませんよ。

 

1.花キラキラ~海物語アレンジ~/CRスーパー海物語IN沖縄3 桜バージョン(パチンコ)/作詞 - ゆう(石垣優) / 作曲 - ゆう(石垣優) / 歌 - やなわらばー
→20014年に三洋物産からリリースされたパチンコ「CRスーパー海物語IN沖縄3桜バージョン」のスペシャル魚群タイム中BGM。
2.Shocking Blue/武装少女マキャヴェリズム/作詞 - 森由里子 / 作曲・編曲 - 園田健太郎 / 歌 - 伊藤美来
3.メニメニマニマニ/てーきゅう(第2期)/作詞・作曲・編曲 - やしきん / 歌 - 高宮なすの(鳴海杏子)
4.departure!/HUNTER×HUNTER(2011年のアニメ)/作詞・作曲 - 羽場仁志 / 編曲 - 新屋豊 / 歌 - 小野正利
5.紅蓮華/鬼滅の刃/歌・作詞 - LiSA / 作曲 - 草野華余子 / 編曲 - 江口亮
6.限界突破×サバイバー/ドラゴンボール超(ドラゴンボールスーパー)/作詞 - 森雪之丞 / 作曲 - 岩崎貴文 / 編曲 - 籠島裕昌 / 歌 - 氷川きよし
7.それゆけ! 乙女の戦車道!!/ガールズ&パンツァー/作詞 - 水島努 / 作曲・編曲 - 伊藤真澄 / 歌 - あんこうチーム [西住みほ(渕上舞)、武部沙織(茅野愛衣)、五十鈴華(尾崎真実)、秋山優花里(中上育実)、冷泉麻子(井口裕香)]
→オリジナル作品監督を務める水島努が作詞をしている。EDシングル「Enter Enter MISSION!」のc/w曲にして「ガールズ&パンツァー」作品のイメージソング。
8.Mighty Love/-/作詞・作曲・編曲 - ユウ/ 歌 - U
→本曲歌唱のUはFuntaのUCOと同じ人である([第3弾]86.参照)。「GWAVE Super Feature’s vol.4 U☆TOPIA 」収録。
9.ここから、ここから/宇宙よりも遠い場所(そらよりもとおいばしょ)/作詞・作曲 - ヒゲドライバー / 編曲 - ヒゲドライVAN / 歌 - 玉木マリ(水瀬いのり)、小淵沢報瀬(花澤香菜)、三宅日向(井口裕香)、白石結月(早見沙織)
10.More One Night/少女終末旅行/作詞・編曲 - emon(Tes.) / 作曲 - emon(Tes.)、ヒゲドライバー / 歌 - チト(水瀬いのり)、ユーリ(久保ユリカ)
11.輪!Moon!dass!cry!/女子高生の無駄づかい/作詞・作曲・編曲 - 山崎真吾 / 歌 - 田中望(赤﨑千夏)、菊池茜(戸松遥)、鷺宮しおり(豊崎愛生)
12.Easy Breezy/映像研には手を出すな!/作詞 - Rachel、Mamiko / 作曲 - ryo takahashi、Rachel、mamiko / 編曲 - pistachio studio / 歌 - chelmico(チェルミコ)
13.Nade-Nadeして/ゲゲゲの鬼太郎(第5期)/作詞 - UZA / 作曲 - UZA / 編曲 - 大野宏明 / 歌 - 今野宏美
→ねこ娘役の今野宏美が歌うキャラクターソング。「ゲゲゲの鬼太郎ベスト~妖怪歌謡集~」収録他、マキシシングルCDも2007年リリースされている。
14.Sincerely/ヴァイオレット・エヴァーガーデン/作詞 - 唐沢美帆 / 作曲 - 堀江晶太 / 編曲 - 堀江晶太、Evan Call / 歌 - TRUE
15.Girlish Lover/俺の彼女と幼なじみが修羅場すぎる/作詞 - 小田倉奈知 / 作曲 - 太田雅友 / 編曲 - EFFY / 歌 - 自らを演出する乙女の会(赤﨑千夏、田村ゆかり、金元寿子、茅野愛衣)
16.片翼の鳥/うみねこのなく頃に(アニメ)/作詞 - 波乃渉(なみの わたる) / 作曲・編曲 - 志方あきこ / 歌 - 志方あきこ
17.secret base 〜君がくれたもの〜(10 years after Ver.)/あの日見た花の名前を僕達はまだ知らない。(2011)/作詞・作曲 - 町田紀彦 / 編曲 - とく Sound Produced by estlabo / 歌 - 本間芽衣子(茅野愛衣)、安城鳴子(戸松遥)、鶴見知利子(早見沙織)
→2001年にヒットしたガールズバンドZONEの「secret base 〜君がくれたもの〜」のカバー(改題バージョン)。 原曲編曲は虎じろう。
18.絶対的幸福論/-/作詞・作曲 - ヨシダタクミ / 編曲 - 藤間仁 / 歌 - 水樹奈々
→TBS『ひるおび!』2017年1月度エンディングテーマ。12thアルバム「NEOGENE CREATION」収録。
19.愛とナイフ/-/作詞 - 畑亜貴 / 作曲 - 俊龍 / 編曲 - 藤田淳平 / 歌 - 茅原実里
→2009年にリリースされた4曲入りマキシシングル「PRECIOUS ONE」のc/w曲。アルバム「Minori Chihara B-side Collection」にも収録されている。
20.ときめきハッカー/-/作詞 - ティカ・α / 作曲 - ティカ・α / 編曲 - イトケン / 歌 - やくしまるえつこ
→テレビアニメ『電波女と青春男』のエンディング曲「ルル」を含むシングル「ルル/ときめきハッカー」のc/w曲。

 

 

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新語・造語・未知語の入力上の待遇④ 漢語複合語

2020-04-28 | ジャンル横断的な問題

①でカタカナ語、②で終助詞を含む文末表現、③では文法機能語と和語 について解説していきましたが今回はようやく未知語解釈の本丸「漢語複合語」についてまとめていきたいと思います。
複合語を論ずるのなら、まず接辞のついた語についてウエイトを置いて紐解いておきたいのは山々ではありますが、ペンタクラスタキーボードの三属性変換のハ万にて接頭語接尾語を含む語の変換を担当させておりますので個々の接辞がらみのケースは別にして次記事で掘り下げていくことにして、
ここでは複合語をおおまかな未知語単位と捉えた観点からの考察と、よくある次々に漢語が結合して長尺の複合語になる(専門的には「臨時一語」「即席合成語」とよばれている)ケースを念頭において話を進めていきたいかと思います。

漢語文字列の待遇上の眼目としては<マルチな複合物としての漢語複合語(長尺複合語)>といわゆる語構成寄りの<熟語構成タイプに基づくもの(主に二字熟語)>は別のものとして考える、というのがあります。
いわば「表面張力解析結果指導原理概要」みたいな未知の複合語が前者であり、「超訳」「統廃合」みたいな新構成の未知語が後者であると捉えます。
前者の長尺の複合語は単純に既知語が逐次的につらつらと連なるだけでしたらシンプルに変換もうまくいくとは思いますが、マルチ複合語には単に語の連結が線上並列しただけとしては捉えきれない、統語的構造解釈を援用しないと適切に変換できない種のものがあるためこれを解釈枠組みに組み入れておく必要性があります。
たとえば「先進物流拠点」の先頭要素「○先進」を「×専心」としないためにも先頭配置ポジションをみての候補割り当ての違いも求められますし、逆に語尾要素なら「ライン生産士気向上」と、向上は接尾語ではないものの統語上の主述の述部として語構成をなしていてこちらも結語としての末端配置というポジションを意識して適切なパーツを提示する任が求められます。
こちらは「ライン生産式工場」としても良いかも知れませんが「-式」(接辞ハ万)「-工場(名詞イ万)」などのように三属性変換へ帰着させる受け皿もありますし、通常変換操作の無標の状態においては「-向上」のように動きのある末尾要素で締めるのも一種のバイアスとして未知語さばきにニュアンスをつけるスタイルとして確立していけば良いと思います。
こういった臨時一語の末端要素は、ニュース見出しなどでもよく見られるものであり、「○数年ぶり提示」「×数年ぶり定時」と文脈によっては判断しづらいケースもあるかとは思いますが、選択フローに非対称性・指向性をもたせるためにあえてモーションのついた「ハネる末端要素」を様式美にまで昇華させることがひとつの狙いでもあります。
まずは第一候補、基底状態においてこのような角度をつけ、あとは随意で三属性変換へ降りて行かせればユーザーもパターンに慣れて予測のつく候補選択フローになっていきますのでユーザーインターフェイスの設計思想からも理に適っていると思います。

長尺複合語は辞書にも登録しきれない臨時造語的なものであり網羅不可能なものと割り切って考えるしかありませんが他方漢語二字熟語の類は極力辞書登録しておきたいところだ、と考えています。
漂着や愛着みたいな素朴な二字熟語はもちろんよろづ素性も含めて登録必須のものでありますが、同じ着でも降着や発着みたいな本義的でないところのものである(叙述必要性から生じた「差異視点語」としての熟語)ものも網羅していかなくてはなりません。
あるいはもっと俯瞰してみると、「試打」「転厩」「残侠」「毛量」「配神」「採番」「退棟」「粘投」などのような、国語辞典に立項されていない(あるいはされにくい)語に至っても最大限登録収録していくとの結論に達しました。
それは従来のシンプルな変換キー一本での変換(これを単相変換と仮に呼称します)では同音語収録をむやみに増やすと変換競合が増えて望ましい変換候補が埋没しかねないリスクが避けられないところなのですが
ペンタクラスタキーボードの三属性変換においては三属性変換のよろづ・ハ万で解釈できる語を通常変換とは隔意をもって別領域に寄せることができるのでそのような問題がなくもし初回の変換で通常変換候補に出ないとしても三属性ハ万を押してやりニュアンスを汲み取らせてやれば容易に立項困難な二字熟語にアクセスすることができます。
あとは学習次第ではありますがこのように住み分けができているので同音語とりたてに億劫になることもありません。
かえって"空きスロット"のある三属性の空白を埋めることができるので積極的に他のよろづにも補充十全性を満たすことにつながります。三属性は鼎立してこそ真価を発揮するものなのでちょっとスノッブな語でも空き属性が埋められるのなら積極的に収録していくことで使わなそうな言葉にも存在意義が生まれてくるのです。
このような効果を単相変換に対比する概念として、「複相変換」「多層変換」と名付けて今後の考察やアピールに活用していきたいと思います。

二字熟語は複数の漢字が結合するところのもので最も基本的なものでありますが「鉄」や「運」などのように一部では一字で意味をなすものもある一方、大方は二字の形で語として用いられるものであり例えば「鉛筆」という熟語では「鉛(えん)」も「筆(ひつ/ぴつ)」もそれ単体では意味が通じない拘束形態素というものであります。
漢字の字音は熟語を作るためのみに存在する拘束形態素となるため断片だけでは用を足せず、面倒ではありますが熟語ひとかたまりをもって個別に記憶させるしかありません。
ここで漢語の内部構造に分け入って、漢字同士の役割分担関係/ウエイトバランス関係が成立することを確認しいわゆる統語論的な観点から参考になるデータをあげて熟語構成タイプについて(他にもさまざまな分け方もあるが)一例を示したいと思います。

<--語構成から見た中日同形語[何宝年 2011] から一部略記も交えて引用-->
(2)複合語
根字と根字の結合関係により二字複合語を次の六種類に下位分類できる。
①連合型②修飾型③主述型④補足型⑤動賓型⑥主語後置型
-------------------------------------------------------------
①連合:名詞名詞-階級子孫夫妻人々人魚/動詞動詞-援助教育進歩彫刻/形容詞形容詞-盛大巨大多少貧富
②修飾:名名-英語液体海軍税金/動名-作品食料住宅燃料/形名-青年勇気/形動-軽視重視
③主述:名動-意向国立地震市営
④補足:動形-改善減少縮小増強増大
⑤動賓:動名-成功演劇営業革命決意延期衛生同情
⑥主語後置:動名-変質変心変色変形出血降雨発病

さまざまなタイプがありますがなぜ即今理解が必要であるかと言いますと、ペンタクラスタキーボードの運用は通常変換だけなら読みと単語だけ、データ字面だけ記憶させればいいのですが看板コンセプトとして三属性の変換というのがありそれを取り回していく上で上記の熟語構成タイプの知識が連想のヒントに役立つと言えるからであります。もとい役立つどころか関係は密接にあります。
まず三属性変換の属性ハ万では接頭辞接尾辞を含むワードの変換を担っておりますがいろいろとコンセプトを煮詰めていく段階において「接頭辞接尾辞を含むワード」→「生産力のあるパーツを含むワード全般」→「熟語構成において役割性の色彩を持つ根字も汲み取っていこう」
、と初期の頃に比べて適用範囲が広がってきており三属性ハ万の守備範囲が拡大中であります。さらには接辞だけを見る形態論的な視点から語彙・語構成をみる統語論的な立場を折衷する方向性へとシフトしてきていることを意味するものであり機械的でモザイク的な接辞捉えからデータ化するのが難しい語彙の持つニュアンスの違いを造語ビルドや同音語候補選択の振り分けに活かしていこうじゃないかというところに落ち着いてまいりました。
もちろん基本的には二字熟語は個別収集的に、統語を考えることなく、時には代表変換のビルドを援用しながらやりくりしていくとの方針に変わりはありませんが時として三属性変換の、ロ万と他のよろづ(あるいは通常変換)の微妙な差異を反映した候補提示・選択の機微というものが如実にあらわれるケースも見逃せないところですので以下例を挙げて解説していきたいと思います。
簡単のために通常変換はN、イ万はイ、ロ万はロ、ハ万はハを頭につけて列挙していきますのでご留意のほどをお願いします。

<語構成の違いによる漢語二字熟語のよろづの違い>※一部兼任もありうる
Nイロ対応/ハ滞欧、イ傭兵/ロ用兵、Nロ保管/ハ補完、Nロ会食/ハ解職、Nロ解明/ハ改名、Nロ誘拐/ハ融解、イ記号/ハ揮毫、ロ裁決/ハ採血、イ分譲/ロ分乗

同音衝突をなんとかいなす為に苦し紛れで属性分けをした訳でありますが例えばさいけつにしてみれば裁き決する裁決も血を採るの採血も漢語語構成に則ったものがありますがこういうどちらも語構成を為す場合は動賓形であったり補語をとるタイプであったりする採血のほうが同じ意味の言葉を重ねる連合のタイプのものよりハ万になりやすい傾向が見てとれます。
さらにようへいのように傭った兵(修飾)と兵を用いる(動賓)こちらも語構成の熟語でありますが傭兵が名詞に帰属できるので滑り込み的に用兵がロ万に落ち着くところをみると用言型の熟語は本来的にはロ万になりたいものの競合熟語との場所争いの関係でイ万になったりハ万になったりするように、絶対的基底的振り分けがあるのではなくて競合との相対関係によって変わってくる性質というのがありこれだという決まりは一概にして言えません。
いろいろ使い分けはあるかとは思いますが用言として使われていれば--する、--される、--はします、などのサ変を伴って使われるパターンであるとかあるいは係り受け的には○○が--、○○に--、○○で--、語彙的には--を試みる、--を続ける、--内容、--目当て、--ぶりといったところでしょうか、前後の接続も見たうえで適切なひな形を当てはめていかなければなりませんし今割り振られた属性というのも例えば(--ぶり)に接続しても自然になる距離感のグループ・ハ万よりはロ万にしてもいいのかな…という膨大な経験則をどこまで反映できるのか
…といった注目レンジを広げていくプロセスの足場を固めるためにも個々の熟語、マイナーなものも含めて二字熟語の掌握網羅を進めていくことが欠かせない課題となっております。

さて二字熟語はくまなく収録するとの方針ではありますがそれでも出せない造語だとかは[代表変換]や[トランス音訓変換]などのビルド入力を駆使して編集していく方法論もあわせて使いたいところですし何より同音衝突選択を回避していくためには地道にユーザーの選択した熟語とその前後の接続フレーズを一体にしてメモリーする学習の効果が使い勝手に直結していくものであるといえるでしょう。
しかし半面、長尺複合語は故事成語・四字熟語等くらいでしたらよろづのラベル付けや前後接続フレーズ学習などもあるかとは思いますが念頭に置いている「臨時一語」「即席合成語」になってくるとよろづ付与もフレーズ用例学習もままなりませんので構文を見た上での候補割り付けやチャンクの語彙的カテゴリや成分や品詞としての性質判断は未知数のまま事を進めていかなければなりません。
これが「扱いを別のものとして考える」ゆえんでもあります。
例えば預金という熟語これを単体としてみれば、(預金を預けるのように裸でつかえない形を帯びていることを前提として)あくまで預金は動作概念であるものの「定期預金」になるとその動作性は薄れて実質名詞のように振る舞います。
一事が万事これが長尺複合語ともなれば単に既知熟語の延長としてよろづ付与・品詞付与をすれば済むというわけにはいかず複合組み合わせのその都度その都度のクラス変化が想定内には収まらないということが容易に推察できます。
中記の例のように二字熟語の語構成(二字複合語を次の六種類に下位分類できる)はよろづさばきに貢献的なデータを提供してきてくれてはいましたが四字熟語、またはそれ以上の長尺複合語も延長上として同様の(統語構造からみた)語構成といったものがあり構造と機能を分析的に読み解いてよろづ付与・構文解析に役立てる手もなくはないのですが、複合語の扱いの込み入った状況を考えるとこれはさすがに現実的ではなさそうです。
このへんの見取り図はいまだ咀嚼の途上でありまして朧げのまま描けてはいませんが、よろづの付与はあきらめておくとして前後の格助詞とかかる連語(○○となる、○○をおこなう、○○が求められる等々...)の外郭的情報・形態的情報をヒントに副作用の出なそうな範囲内で複合語チャンクを既知二字熟語チャンクに倣ったカタチで処理することができれば良いと思います。(単チャンク語とみなす)
とはいえ統語までは読みとれないにしても配置位置によって適切な候補を勘案するぐらいの芸当は求められるものでして、現行布いている三属性変換・ハ万(接頭辞接尾辞を含むワード)との守備範囲の微妙な重なりも踏まえつつその他の作用要件や傾向も洗って検証していかなくてはなりません。
さまざまな考慮要素がある中で少しでも見通しをつけるためにドン・キホーテ型にざっくり粗要素で集約してしまうと以下のようになります。

統語というよりは配置に注目した連接タイプについては次の資料が役立ちましたので一部引用してみます。

<国語辞典と四字熟語 ―辞書にのる語とのらない語―[中川秀太 2014]より>
なお、辞書に「接尾辞的」などの記載はない語でも、以下のようなものは、多くの四字熟語を生み出しており、造語力がある。
--一色(戦争一色) --格差(科学格差) --合戦(取材合戦) --気分(厭戦気分)
--規模(宇宙規模) --経験(軍隊経験) --主義(効率主義) --人生(作家人生)
--物質(化学物質) --方法(演出方法)

<-中略->

前部分については、
異常--(異常事態) 一斉--(一斉送信) 一般--(一般雑誌) 個別--(個別活動)
最終--(最終候補) 重要--(重要単語) 専門--(専門雑誌) 直接--(直接対話)
同時--(同時受賞) 特殊--(特殊能力) 有名--(有名作家) 有力--(有力企業)
臨時--(臨時閉店)

――生産力のある要素が配置され語のカラーを支配しているプレゼンスを持っているとは言えます。しかし念のためこれをひとチャンクで見た時に後続チャンクとの関係性・ふるまい上の役割の源泉としてどこまで寄与しているか、言い換えれば語としてのプロトタイプ性を発揮していると割り切れるものなのか、結局は個々の接続語彙の意味合いによって左右されるものだとは思いますが更なる見極めが求められるものだと思われます。
この例とは別に、「こうぎ」という複合語パーツをもつ複合語をいくつか考えてみますと、
--講義(遠隔講義) --抗議(道庁前抗議) --広義(×茫洋広義)
などのように講義は講義終了とかの場合でなければもっぱら末端部(--講義)に配置されやすい傾向を持っていますし、抗議は末端部(--抗議)であらわれるものと先頭部(抗議--)であらわれるものと半々ぐらいといったところでしょうか(講義殺到・抗議電話)。
そして最後の広義は連体修飾(第三形容詞的、--の○○の形で句を形成する)で使われるからでしょうか、裸で末端部(--広義)で使われることはありませんし不思議なことに先頭部(広義--)で使われることも稀です。
このように先頭志向なのか末端志向なのかあるいは両方兼具なのかの素性によって変換文字列に当てはめるパターンを使い分けなくてはなりません。
言語学でいう形態論では一般的に(日本語の名詞複合語には)、複合語パーツの役割分担として意味的・形態的要素を受け継ぐ「主要部」が存在し、例えば「青色確定申告」のプロトタイプを担う部分「申告」・主要部は大半の場合最も右方(後方)に位置する、とされています。(他方、左側要素は「修飾部」「補足部」)
しかし先程の「こうぎ」のさまざまなバリエーションの例を目の当たりにしますと形態論的な視点は今一度肩入れし過ぎず、根源的に語のもつ語彙背景の事情をもっと加味して精査していかなくてはならないと思います。
なぜなら「青色確定申告」にしてもちょっと末端に語を足して「青色確定申告納付」とかにしてしまうと主要部が土壇場でうっちゃられてしまい「右側主要部の規則」はリニアの入力文字ストリームからしてみれば解析確定にそぐわない類の性質のものでありあまりこの規則を軸にして物事を進められないな、という感触があるのです。
ここまでが粗要素のまず第一の要件、「複合語構成パーツが先頭志向なのか末尾志向なのか、また兼具するものはより弾力的に構文解析のプロセスにおいて特徴検知材料として判断に役立てる」という題目を立てました。

続く第二の要件は「語+語(語連結境界が独立)としての複合だけでなく、元は句構造・項構造をもったフレーズであったものが助詞省略や格関係叙述連結によって見かけ上逐次形成複合語のように生成されるものも同じまな板の上にのせて未知語解析を行い異質の構成規則でも併呑していける懐の深いチャンク解析を目指す」であります。
ちょっと抽象的な物言いになってしまいましたが駆け足で説明を進めていきますと、こちらも文書:複合語のタイポロジーと日本語の性質:「日本語は特殊でない」というけれど[影山太郎 2010]から2タイプの語形成トピックをかいつまんでとりあげます。

<形態的緊密性のテストでも「語」として判定される統語的複合語のうち2タイプ>
・S構造複合語
 a.学生が[エレベーター|使用]のときは
 b.飛行機が[成田空港|着陸]の際
 c.[ビル火災|発生]の場合は
・動作主複合語
 a.[国語研究所|主催]のシンポジウム
 b.[スピルバーグ監督|制作]の映画
 c.[プロカメラマン|撮影]のポートレート
 
※いずれも|以下述語/動詞を和語に置き換えようと試みても成立しない、接続要素が漢語のときにだけ許容/成立する特殊性が際立つ
※S構造複合語においては、「図書|貸し出し」のように複合動詞ならば一部和語でも成立する場合がある
※動作主複合語においては、「[母親作り]のケーキ」「[夏目漱石書き]の手紙」などのように「他動詞とその主語を複合させることはできない」という制約があるが(世界中の言語に共通して見られる普遍的法則として)
日本語の漢語で構成される複合語においては例外的に成り立ち格標示を持つ統語構造に直接対応する

…助詞抜きで連結された複合語は名詞要素+名詞要素みたいなものとは違い、先の「学生がエレベーターしよう」の例にしても「×エレベーター仕様」にしないためにも「使用」のもつ統語的複合を結語とする解釈を通常変換では第一義的なものとして確立したいというのがあります(エレベーター仕様については接辞のついたチャンクであるので三属性変換:ハ万で処理すればよい)。
なんだ、仕様にしても使用にしても形態上は抽象概念名詞/動作性名詞なのじゃないか…などと今さら品詞ベースで物事を言っている場合ではなくて統語上の役割や語彙的親密範疇などをより重く見て未知語に対峙していかなくてはなりません。
これとも関連の深そうなトピックとして、新聞・ニュース見出しで使われるフレーズもあわせてこの種の複合語構成の摂理を喚起するものであるので以下例をメモしておきます。

<ニュース見出しの助詞抜きフレーズの例>
感染再拡大懸念 3000億円融資要請 費用負担同意 再生エネ拡大 超美品最安値挑戦 今期電撃移籍
…ここまでが第二の要件です。結論としてはこういった助詞抜きで生成される複合語の可能性やそのとき結語になるであろう一連の語群を地道に収集・分析してこちらもやはり結語配置タイプに応じた適切な変換候補のデータを充実させていこうということであります。


…さて最後の第三の要件でありますが、こちらでは少し目先を変えてみまして音韻的特性に目を向けていきたいと思います。
日本語の漢音語の音韻パターンには規則性があり一般的には「日本漢字音は多くて2拍だが、その第2拍目に来れるのが『イウキクチツンしかない』」という法則があるのは広く知られるところであります。
この法則をさらに深く突っ込んで調べていきますと先人の提案した偉大な日本語入力方式:「M式キーボード入力」(森田正典)の入力仕様から漢語複合語入力に際しての理論的なエッセンスを得ることができます。

以下(日本語ワードプロセッサ用新入力方式:M式-コンピュータ博物館)より引用したいと思います。

日本語における漢字の音読みの5つのパターン

1) 可,気,苦,固のような単音で第2音が存在しない単母音型
2) 開,空,経,甲のように第2音が母音で,UまたはIで表音できる複合母音型
3) 漢,金,君,検,混のように第2音が「ん」で,Nで表音できる内音型
4) 格,菊,刻,策,色のように第2音が「く」,「き」で,Kで表音できるK型入声音
5) 活,吉,屈,決,骨のように第2音が「つ」,「ち」で,Tで表音できるT型入声音

上記の性質を利用して,1)の単母音用,A,I,U,E,Oの他に,2)のタイプ用に,Ai,Ii,Uu,Ei,Ou,3)のタイプ用に,An,In,Un,En,On,4)のタイプ用に,Ak,Ik,Uk,Ek,Ok,5)のタイプ用に,At,It,Ut,Et,Ot,の母音キーを設け,さらに,ひらがな入力専用の単母音キー,a,i,u,e,o を加えた. 
<---引用終わり--->

…これらは漢語複合語ならずとも単漢字で適合する法則ではあるのですが、この音韻パターンを持つ文字列が複数個連続して並ぶということになればそれは漢語複合語であると判定できる(可能性が濃厚である)ので未知語チャンクにこの判定を布くことで漢音複合語の音韻要素拾いの補強支援につながると考えております。
単に文全体を見て闇雲に音韻パターンを当てはめていくというのではなくて、局所的に当たりをつけてからそこに音韻パターン判定を適用するということでありますので限定的であればチャンクの分析も少しは実現可能性があるかと思います。
文解析においてすでに第一段階の「機能語トリートメント」のフィルターをくぐり抜けてきたことで構文素材として各々のチャンクはお手玉化(?)するとして、残る残留物として未知語チャンクが素性不明のままそれはそれで全体の文の中ではパーツ組み入れが存立している状態となっている…のでありますから文構造の見立て掌握は確保しつつも未知部分だけ局所的にチェックできるというのが大きな利点であります。
他にも音韻パターンを観察していきますと
・漢語音韻ではちゃ、ちゅ、ちょ などの拗音パーツも見られるが、「ちゃ」「ちょ」のみ漢音1パーツをなすことができる一方、「ちゅ」は「ちゅう」と複合母音型になるときのみ成立する音韻パターンがある
・「びゅう」(謬)、「にく」(肉)のように珍しい音韻パターンもあることにはあるが、「ぴゅう」「でょう」「びょく」「なく」「につ」「ゆん」などのパターンは認められない
・同じく「ざく」というパターンもあることにはあるが「阼」「筰」「鋜」等低頻度漢字であるのでこちらは通常の変換プロセスでは稀なものとして捨象しておいてもおおむねよく(単漢字変換でリスト候補が出せれば良い)、「朱雀」のざくに関わる変換だけに留意しておけば事足りる
・「脈管」(みゃっかん)、「客活」(きゃっかつ)、「十戒」(じっかい)、「玉壺」(ぎょっこ)のような詰まるときに形成される音韻パターンも漢語音のバリエーションとして考慮しなくてはならない
・逆に出てくるだけでこれはカタカナ語フレーズの断片であると判断できる音韻字音パターンがある(ミュやファのような音やー(長音)つづりの音、あるいはヴ行)

…M式入力仕様の分析だけでなくこれらの漢音/カタカナ語音韻パターン特性のフィルターを未知語処理に組み込んでやれば形態情報や統語語構成だけではなく音韻パターンの側面からも漢語文字列の扱いにおいて確度を高めることにつながると思います。
とはいえ3つの要件の中では異色の考慮ファクターであるのでプロセスのどの段階でこの処理を組みいれればよいのか、語構成や助詞抜き、先端末端配置などの「語と語の相互関係」をみるパースペクティブな方法論と音韻パターンだけを見るリテラルな方法論を併走させ得ることは可能なのか?といった疑問など解決すべき問題は山積しており未知語解析としての漢語複合語の扱いは今のところまだ整理できてはおりません。
この記事では未知語処理の棚卸しとしてこれらの課題があることをまず認識してとりあえず現状の材料としてこんなものがあるんだよ、ということを示すことができただけでまずは良しとします。

最後に再度漢語複合語処理の対処法の3つの粗要素をもういちどメモして記事のまとめとしたいと思います。

<漢語複合語の未知語処理:何を軸として解決していくか--3つの指針>
・複合語構成パーツが先頭志向なのか末尾志向なのかよく素性をみる
・助詞省略や統語的複合語も形態的複合語もおなじまな板にのせて複合語処理をする
・音韻特徴パターンの援用

<考察に役立った文書やサイト様>
・語構成から見た中日同形語[何宝年 2011]
・国語辞典と四字熟語 ―辞書にのる語とのらない語―[中川秀太 2014]
・複合語のタイポロジーと日本語の性質:「日本語は特殊でない」というけれど[影山太郎 2010]
・IPSJ Computer Museum コンピュータ博物館[http://museum.ipsj.or.jp/index.html]

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新語・造語・未知語の入力上の待遇③ 文法機能語と和語

2020-04-12 | ジャンル横断的な問題

ここではまず複合語構成要素としての和語の存在について論じていき、それに加えてこの後の記事の漢語複合語に取りかかる前の地ならしとして文法機能語の解釈について掘り下げていきたいかと思います。
文法機能語なので必ずしも未知語複合語の関わりとは薄いところがあるかもしれませんが、解析に関わる未知フレーズが機能語がらみで出てくることも大いに考えられますので文章を統語的に理解するというプロセスのうえでも風通し良く議論の道筋をつけたいという意味においてもどうしても触れなくてはいけないところですのでどうぞお付き合いください。
和語と言ってもいにしえの大和言葉の使い方のような大仰なものではなくて現代文で普通に使われる基礎フレーズや複合語要素としての和語の存在に焦点を当ててその傾向や法則に少しでも迫っていければ良いかと思います。

まず和語の混じる複合語を何の気なしに思い浮かべると◆「レッズびいき」「おしどり棋士」みたいなところがあげられるでしょうか。これはシンプルに既知語+既知語→合成未知語の組み合わせですから表記には気を配りつつも漢語+漢語複合語やカタカナ+漢語複合語などと同様に処理していけば特に問題はないと思います。それに和語とは言っても生産力の高いパーツで付加されているので接頭辞・接尾辞入力操作の扱いの範疇でできることも助けになります。
◆「注文忘れ防止」「捧げもの絵」このケースは動詞活用形で少しニュアンスのついた和語が混ざっていますがどうやら複合語要素になるときには連用形の転成名詞化しているフォームを保っているのが特徴的ですから動詞検出/活用形の推定ができたのなら連用形だった場合の連接やりくりは名詞または複合語要素の連接ふるまいに捉え直して二語三語以上の複合語の時でも順次連結して語尾成分の接辞パーツとなめらかに接続できるよう解釈していければ良いかと思います。
◆「解放どころ」「添え物ばかり」このへんになってくると接辞というよりは統語構造においての機能(ペンタクラスタキーボードならイ万ロ万ハ万三属性)での役割変化も気になってくるところです。
--どころ、--ばかり、は確かに生産力パーツとしての形態を持ってはいるのですが例えば「ダイエットどころじゃない(文脈)」「人気のダイエットどころ(場所)」と構文での文法機能が異なってくるケースもあり、解析の助けとしてユーザーが三属性変換のよろづを選択することによって「ばね量り」/「バネばかり」のように区別することが役立つ場面もあるかもしれません。
さらに接辞や複合語だけにとどまらず◆「知識欲ゆえ」「中毒性たるや」「哀れ民草」みたいな例では副詞的、枕詞的、連体詞的?、など判断のつきづらいカテゴリではありますがこれらのパーツも確かに生産性の高い、つまり未知語の生まれやすい土壌を持つフレーズであります。
別口入力できる要素は一文字粒のモノでなかでも頻出のものだけに限られますので純に未知チャンクを複合語のカタマリと期待することはできずに必ず非レギュラー助詞や機能語、あるいは助動詞の活用変化の一部などが混入している場合にも備えなければなりませんので
ここまで段階的に典型的未知語から範疇不詳の未知語へと視点を移しつつ説明してきたのですがこのように(内容語でない)機能語を取り扱うということはまずそれらをひとチャンクの中から分離して複合語処理前段階のまな板を整えるフェイズが必要になってきます。
この分離フィルタリング中に文法構造に見通しをつけたのち接辞同様に複合語要素に組み込んでも良い文法語が浮上してきたのなら「分離からの再統合」を適切に行って先述の「ばかり」や「たるや」などを複合語解釈のラインに載せていきます。
これら一連の処理を本ブログでは「機能語トリートメント」と名付けて今後この言葉を援用して解説を進めていきたいと思います。
なおただいま記事展開しております「入力上の待遇①~⑧」の記事テーマのカタカナ語・ひらがな語・漢語複合語・接頭辞接尾辞...etcの各記事は複合語の取り扱いについてあれこれ考察していく際には、この「機能語トリートメント済み」の前提で話を進めていきたいのでどうぞよろしくお願いします。

機能語に関してさらに少し申し上げますと、先の例「中毒性たるや」の「たるや」に注目していきたいと思います。
このたるやには2つの入力法があり一つは助動詞[たり]の連体形に助詞[や]の付いたものとしてのものがあり、それとは別に[や]こそ別口助詞入力を添えるもののこのひとフレーズで連語チャンク化しているのもあってか厳密に別口入力[や]を要求するものでなく「たるや」をべたのひとかたまりで入力することを許容しています。
そのため別口付随でもべた入力のどちらでも使い分けに不自由がないようにするために三属性変換(+通常変換)のユーザー入力によってこれを選択できる機構を用意しています。
別口助詞付きの「たる[や]」の場合は機能語としての「たるや」(通常変換)の場合と「足るや」(ロ万)、「樽や」(イ万)の場合の3つの解釈があります。
かたやべた入力の「たるや」の場合はこちらも機能語(連語)としての「たるや」の場合と「樽屋」(イ万/ハ万兼務)の場合の2つの解釈があります。
どちらの場合であってもまず通常変換の機能語としての「たるや」は最上位判断で通常変換の基底を保持し、そこから特定の具体性を帯びる各種のよろづの受け皿は下位振り分けの三属性変換に委ねていきます。
このように機能語とのカラミのある複合語解釈では通常変換バイアスとの競合がにわかに浮上してきますが大抵の通常変換候補は機能語と結束しているものを優先的に提示していきますので
例えば通常変換で「貸そうとしない」と出てしまうところを複合語に解釈する「仮想都市内」に捉え直してほしい時には名詞解釈のイ万のキーを押すか接尾語「内」がついているので接辞モノ解釈のハ万のキーを押してユーザーの意図する複合語を選択していきます。(もっともこの例では別口入力の[と]が入っているので適切な例とは言えないのですが簡単のために導入させていただきましたご容赦ください(^^;))

さて前回の記事では結局未知語は基本カタカナにすればいいみたいなニュアンスで言っていましたが文法機能語は大和言葉ですのでうっかりカナにしてしまうことがないようしっかり検知していかなければいけません。
そのこともあってか事ここに至って「機能語トリートメント」という準備処理をしっかりこなしたとの確証をもって、ひとタスクを済ませてはじめて複合語解釈にいけるのだということを再認識しなければならないということです。
今はまだ解決策が固まってきてはいませんが、「樹木希林 直筆コメ寄せ心境」みたいなニュース見出しみたいに凝縮された複合語フレーズなどへもゆくゆくは対応できるようにどの語とどの語の接続を連接可能性として許容していくのか、その語彙性質、品詞・よろづ・活用などの抽象クラス、あるいは語頭/語尾での配置特性の有無などの条件をうまく整理して未知語の解釈さばきの方法論を確立していきたいと現在奮闘中のところであります。

最後に複合要素としての和語を語る上で外せないトピック、「複合語連濁」についても触れておかねばなりません。
日本語においては複合語後部要素初頭の清音が濁音に変化する現象が見られ、これを連濁といいます。
連濁は主に和語にだけ起こる現象で漢語や外来語との接続では基本は濁らないものされています。ホットゲーキ(ほっとげーき)であるとか開発計画(かいはつげいかく)などとは言わないのはいい例です。
ただし元は外来語であったとしても完全に馴染んでしまって日本語化された言葉では連濁を起こすものがいくつかあります。(株式会社かぶしきがいしゃ、いろはガルタなどの例)。
ちょっと規則が面倒なのですが、

・従属関係の複合語は連濁し得るが、先の語とあとの語が反意語や並列関係の場合は連濁しない(読み書き、飲み食い)
・あとの語に濁音がある場合は連濁しない(おおとかげ、*反例:なわばしご)
・先の語に濁音がある場合は連濁しない(永田、ハゲタカ、*反例:むぎばたけ)
・音象徴語(擬態語・擬音語)の場合は連濁しない(てとてと、こりこり)
・ただし同じ繰り返しでも複数/性状様相/強調の機能を持つ畳語の場合は必ず連濁する(懲り懲り、細々、端々)

などの法則があり、とはいえ慣用から機能形態由来までさまざまな例外があり現在においても漏れのない定義は整っていないのが現状であります。
未知語処理においては最初の項で触れた従属関係の複合語(<修飾・被修飾の関係>と<主語・述語の関係>を持つもの)が大きな課題となるところで、その下位ポイントとしておおとかげやハゲタカ例のようなところを修正事項として捉えていけばいいものと受け取っています。
未知語造語の語と語の関係(統語構造)にまで分け入って適切に変換候補をあて込むことは現状ではかなり難しく(特に次記事の漢語複合語になるとその難易度は想像もつかない)、構造理解を一部簡略化して接尾辞的な生産力の高い和語造語パーツに的を絞ってこれをおこない、
従来のIMEではあまり重視されてこなかった"連濁する方の接尾辞"を登録単語にくまなく収録することで少し強引ですが乗り切っていきたいと考えています。
なぜ従来のIMEでそういった辞の充実がなかったのか理由は定かではありませんが、おそらく既存の語との無用な衝突・混線を避ける為であっただろうと考えます。
しかしペンタクラスタキーボードでは通常変換で望む変換が出てこなかったとしても三属性変換へシフトして属性を絞っていくオルタナティブな救済手段が手厚く用意されているのと、そこからの学習登録の効果を加味すれば衝突も気にせず語彙資源を利用できますし
何よりも通常変換のバイアスがかかることで常に角度のついた一定のパターンに沿って変換候補へたどり着く導線が保証されているのが闇雲な混線を招きにくくなっていて、これは大きなアドバンテージだと自負しているところであります。
抽象的なことはともかく実際に役立ちそうな接辞要素を列挙してみますと

「おどり炊き」「学級づくり」「生悟り」「古豪揃い」「大阪住み」
「普段履き」「スキン替え」「センター帰り」「SNS断ち」
まれであるが接頭語例:「映えスポット」

などがアクセスしやすければ重宝しそうです。これは単に動詞の連用形を名詞扱いすればいいというものではなく、帰りには返りなど他の競合語に埋もれないように接辞要素を多分に意識した候補出しにするとともに連濁活用が基本活用の枠組みの中では十分に反映されないところを補う意味でも網羅的にパーツを収録していくというのは大変重要なことだと強調したいところであります。
また動詞ばかりでなく語幹を埋没させやすい形容詞一般の造語要素にももちろん適用させていくのが最善であると思います。こちらの例は

<接頭辞要素(形容詞)>
「旨シェフ」「塩握手会」「ゆる受験」「痛スマホ」「凄得クーポン」「甘デジ」「だる着」
<接尾辞要素(形容詞)>
「つれ安」「鬼強」「ふわ軽」「ブリ寒」「最薄」「修羅エモ」

などこちらもセールス広告やネット流行語などの場面で役立ちそうです。
形容詞の接辞使いには接頭語も割と多くみられるのが特徴かもしれません。
接辞要素を受け持つ三属性変換・ハ万の変換ではありますが、辞の意味成分からダイレクトにイ万・ロ万に飛ぶのもよし、一度ハ万を経由してからのイ万/ロ万への遷移を使って目的の未知語にたどり着くもよし、
単に接辞としてだけ見るのではなくそこに含まれるよろづ的傾向:安いなら安→様態属性のロ万、といったふうに形態を越えて語彙概念の味付けにもうまくはたらきかけることができれば目指す理想形へ一歩近づくことができるのではないでしょうか。
こうして見ると和語は漠然とひらがな文字列が並んでいるようなイメージでしたが広く訓読みのできるワードはそもそも漢字として存在しているものが数多くあるのでやはり「かな漢字変換」、漢字に変換するというプロセスが和語でも決して外すことのできない表記ケアなのだということを再認識させられました。
最後のほう、ちょっと番外で「エモい」なんてのも入っておりますがこれは外来語由来ではあるものの「-い」がついて形容詞化された新語としての接尾語要素ですので運用としてはもはや日本語和語の範疇で処理しても良さそうでもあり、このようなカナ/横文字+[い]の形の造語なども定着度によっては接辞要素として処理することもありうるかと思います。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする