P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

宿題が増えた

2020-01-29 | アルファベット液晶入力+テンキー部

<タッチ液晶部(従来案)>

タッチ液晶面を見ていますと2018年7月にセットモード切り替えについていろいろ論じあげたもののそれ以降は特に触れることもなくここまできていました。
液晶関係は英字入力だけでなくタイプした文字を手元で確認できるようにすることも大事な点でしたがそのへんがすっかり抜け落ちてしまっています。
手元の液晶画面で入力文字列のタイプ状況を表示するためには上部に表示領域をとらなければなりませんしその分実質的なタイポにあてるキー部分が減ってしまうのは否めないところです。
タイポ要素の各キーはおおざっぱに5段×10キーのマトリクスで占められていますがこれをスクラップ&ビルドし直して4段×12キーみたいにして上部の領域に新たにスペースを生み出そうというものを考えています。
デリートや文字セット切り替え(abc⇔123)などとかの役物やその他下段を占めていた雑多な記号類を4段の縦領域のそれぞれ左右両端にスプリットさせて縦を縮めて横をワイドにする…といった具合です。
そして画面状況や実測のスケール感などを考えていますとこのままでは液晶面が少々手狭かな、という判断に行き当たりました。
そこで今回(前々から考えてはいましたが)長らく定着していたと思われた全体レイアウトに思い切って領域バランス変更をほどこして下図のようなイメージで尺をいろいろ弄ろうと決心いたしました。


<液晶面のワイド化にともなう全体レイアウトの調整イメージ>

修正作業にはちょっと時間がかかりそうですのでしばらくお待ちください。ひょっとしたら夏までくらいになるかも知れません。
あわせてタイプ文字表示領域の文字数限界をどうするのか、ペンタクラスタキーボードには「でにをは別口入力」があり変換確定までの一フレーズのスパンが長めになることを謳っておりますのでそこの一フレーズがまるまる収まりきらない場合はどうするのか
さらには異字種混在環境を快適にするには英アルファベットだけでなく多言語の入力環境も整えた方が良いのではないか…との意味からサブ言語タイプ支援のための呼び出し・切り替えのキーなどはどうするのかについても検討していくことにしましたので
タッチ液晶キーの最大の利点でもあり特徴でもある≪操作対象がレイアウト・刻印部分含めオブジェクトそのものが時々刻々で可変になる≫という性質を十分に理解したうえでさらなるインターフェイスの向上を目指していきたいかと思います。

なかなか手ごわそうな課題が並んでいますがひとつひとつ丁寧に解きほぐして物理キーと電子キーの兼ね合い、手元感覚と表示情報の必要十分要件などをじっくり考えて最適なオペレーションを設計していきたいと思いますのでよろしくお願いします。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

異業種フィールド横断ビジネスの最後のシナジーは『言語』である

2020-01-23 | 当ブログの基本的な考え方・方針・見解

 

早稲田大学ビジネススクール教授の内田和成氏による著書『ゲーム・チェンジャーの競争戦略 ―ルール、相手、土俵を変える。』を読みました。
企業間競争においてテクノロジーの進歩、物流の効率化、グローバル環境の変化、イノベーション発想の転換などによって既存の支配的だった企業が否応なしに競争に巻き込まれ
従来のビジネスモデルではうまくいっていたものが新しい局面では逆に変化に踏み切れない足かせとなって新興の競争相手に打ち負かされてしまうケースがみられてくるようになってきました。
競争のルールそのものを変えてしまう「ゲームチェンジャー」の出現にどのように対抗していくのか、この本では攻める側だけでなく攻められる側――既存プレーヤーの戦い方にも注目して戦略の鍵となる要素を我々に示してくれます。
なかでも印象に残ったのが競争を仕掛けてくるゲームチェンジャーの4つの類型
・秩序破壊型(Breaker)
・市場創造型(Creator)
・ビジネス創造型(Developer)
・プロセス改革型(Arranger)
のマトリクスの説明と各章がそれぞれのテーマを掘り下げて詳述してあるところです。
私自身の理解力と読み込みが足らなかったせいか「市場創造型」と「ビジネス創造型」の違いがよく分からなかったのがありますがこのブログで描く未来展望を念頭に置きますと大いに触発されるものがある内容でした。

最近特に気になるのが「プラットフォーマー」と呼ばれる多数の消費者や事業者の基盤となる製品やサービスを提供している企業とその動きです。
例えばGoogleは検索(とその広告)だけで食っているのではなくてMapやYoutube、AndroidOS、日本語入力なども手広くやっていてその影響力は今や私たちの生活に欠かせないものとなってきています。
Amazonもショッピングだけではなくてプライムビデオや音楽ストリーミングやAWS(クラウドウェブサービス)などその事業領域は多岐にわたっています。
両者に共通しているのは展開する事業領域が単一・専業ではなく、ITのシナジーを余すところなく活用し多方面に展開していながら経営資源がバラバラになるのではなくてトータルでしっかりと統合されている事です。
特にAmazonプライムのサービスなどはプライムビデオ動画と映像ソフト販売の食い合いも内包しつつの構えではあるものの、お急ぎ便やプライム配送料無料のメリットもさることながらKindle電子書籍からミュージックまで生活からコンテンツ環境全方位の至れり尽くせりぶりは見事というより他はありません。
彼らは異業種の垣根を取り払うことで有機的なシナジーを生み出し、ビジネスの総体を拡張しながらユーザー目線の巨大なエントリーゲートを構えて丸飲みしてくるかのようです。
これは私見ですが、今や飛ぶ鳥を落とす勢いのNetflixやHuluのような専業的プラットフォーマーは今はいいですがこのままソリッドな形態のままでいると一気に形勢が動いてしまうリスクを裡にはらんでいるのではないか、と思っているのです。
動画サブスクリプション業界は目下競争激化で新たな参入者も控えておりせっかく育った市場ではあるのに消耗戦で焼け野原になってしまう展開が待っているのやもしれず、市場の動向は目が離せないところであります。
そういった意味では専業事業者にとってはややリスクが高いのではないかと一段下の認識を持っています。
もちろんプライムビデオのラインナップは前者に比べるとやや見劣りがしますがAmazonはサービス総体でいえばまだ情勢に柔軟に対応できるだけの方策のバッファがより大きいように思えるのです。
しかし専業では一本足であるところの脆弱性ゆえか突発的事態に対してできる選択肢が限られてくるのはよく考えれば自明の理でありますし今後の動向を注視していくことが求められていくと思います。

ここで今回の記事を作成するのに役立ったWeb上の記事、特に異業種をライバルとみなす現代の趨勢を読み解く記事があったので下にあげておきます。

Netflix「ライバルはフォートナイト。すでに負けている」と発言。TV画面の奪い合い激化 - Engadget 日本版
・私どもは、自分たちのライバルは何だと考えているかというと、「お客様の興味関心と時間とエネルギーを奪い合うすべてのものがライバルだ」と思っています。特定のものだけをライバルだと考えますと、「そのライバルにいかに勝つか」という発想になるんですね。(任天堂:岩田聡)
2010年6月29日(火)第70期 定時株主総会 質疑応答
トヨタ「ライバルはもうホンダではない」の真意 全ての企業の競争相手はGAFAである | PRESIDENT Online(プレジデントオンライン)

さて、当ブログでもぶちあげているペンタクラスタキーボードの目指すシナジーとはいったい何なのか…単に日本語入力・IME・テキスト作成の枠内だけにはとどまらずいろいろ夢想しながら業界を股にかけていくのだ、と意気込んでおるところであります。
コンテンツ方面もマーケティングの新領域も手を尽くしたとばかりに腕組みしている場合ではありません!新たなフロンティアを模索しているのでしたら原点に立ち返って残された最後のシナジー、『言語』をもう一度見直してみてはいかがでしょうか?
業界関係者様、アカデミック方面の方々…コーディネートお待ちしております。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未知語を複眼的に概観する

2020-01-19 | 文解析は副詞が鍵

変換メカニズムのあらましが見えなかった頃は<カテゴリ:文解析は副詞が鍵>の見通しまで勘づくのがやっとで
まだ素朴に「解析でカバーしきれない未知語はとりあえず全部カタカナ語に変換しちゃえ…いらん複雑怪奇な誤変換であがくよりよっぽどいい。」
…なんて思っておりましたが考察を深めていったほんの触りの感触では「これはどうも簡単にいく話じゃなさそうだな…」というのが頭をもたげはじめています。

品詞でいえば未知語の多くはカタカナ語/漢語複合語/接辞生産物に関わらず固有名詞の類がもっとも顕著な勢力であるかと推測します。
確かに動詞形容詞形容動詞の未知語もあるにはあるのですがペンタクラスタキーボードの別口入力マーキングの助けもあって
造語動詞の--る、みたいなものは別口入力[○R][×r]ならびにそのテ形の[て]キーがありますので新語の類はこれで凌ぐとして
非ル形動詞で純に大和言葉な未知の動詞、たとえば「などう」みたいなものをひねくりだすことも考えられなくはないですがそこまで心配するのは稀で当座の既存の辞書で大方間に合うかと思います。
ちょっと不安なのは複合動詞や補助動詞とのバリエーションですが少しラッキーなことに複合動詞は「×疑問禁じ得ない」「×駅降りそびれた」みたいな助詞抜きフレーズになりにくそうな気配が漂ってきていますので助詞・格関係をヒントに動詞部分の捕捉がシャープにできそうですので未知語との混線も和らぎそうだな…と楽観視しております。
動詞連語表現においても「~する」のサ変動詞関連にはかろうじて[便利キー・し]がありますので連用形「し」で同音混線するリスクだけは避けられますし、終止形/連体形「する」なら尺があるので未知語の受け皿として特徴検出も対応できそうであります。
あとは「~である」「~になる」「~ている」も別口パーツが効いているので問題ないでしょう。
一方形容詞は対応する別口入力のパーツがないのがちょっと心配ですが形容詞には造語生産力もあまり高くないので構想段階なら軽視しても良い、と考えます。
そして形容動詞にはもとより別口パーツ[だ][な]がありますしこちらは生産力はあるもののほぼ「--的な」やカタカナ語でいけると思いますのでこちらも性質は悪くないと思います。
最大の懸案が「活用なし用言」なのですがこれの考察は後に回すこととして今は品詞視点や通常変換での振る舞いに注目していきつつ話を進めていきたいと思います。

さて文解析の次なるフォーカスは助詞(でにをはのような単文字ではなく複数文字助詞)の類(さえ・より・から・まで・くらい・ほど・しかetc...)などや
(みたい・ばかり・まま・副助詞のほど・だけ・がち・あげく・~といい…といい・~みたい・~のおりには・打ち消し+じまい...etc)などのような文法的機能語などでありますが
文法トピック的には内容語と機能語の対立みたいな切り口でいくと文の個々の素材となる名詞/体言は未知語候補の筆頭に控えるという見通しが容易に立てられますが、
叙述においても副詞の作用込みであったとしても文の実質としてはたらく「内容語」としての動詞・述語は主語客語を携えて配置されるのが大きな構造上のヒントになりますし
体言を修飾する装定ならば終止形と同型であるとはいえ体言に前置される配置上の特性で見立てはつきそうですし最低限「Ø」(新別口入力の区切り要素:ゼロ文字マーカー)の助けを借りればセパレート認識できます。
また、「ひどく(形容詞の副詞的用法)疲れた様子だ」「期待に応えるよう(動詞の副詞句形成)頑張ります」みたいな連用修飾の検出は動詞検出それ以前の≪通常変換プロセスでは副詞の捕捉を最優先にする≫の方針を定めていますから、
活用変化にもなんとか追いついて捕捉のフィルターは有効にはたらくことを期待しています。
機能語全般に関していえば助詞のほうは付属語として他の語に後接しているのでいきなり登場するものでない吸着力があります。体言に接続する格助詞のほとんどは「でにをは別口入力」ですでにカバーしておりますので、残る接続助詞・副助詞(終助詞は別として)は単文字ではない2文字以上のものが残るわけでそれならいくらか捕捉も目途が立つというものでしょう。
その他の機能語のほうは未知数ではありますが今後の考察でなんとか解決するということで…空手形ではありますが同様にやっていければ良いと思っています。

…と、ここまで書いてきて勘の良い読者の方ならすでにお気づきでしょうが、通常変換(モダリティやひらがな表記規範重視)のプロセスと動詞・述語検出(副詞と対応付けたうえでの)のプロセスは並行してはいますがこの両者の微妙な差異をにらみつつ、私としてはある狙いのもとに「(未知語でない素材の)捕捉・検出フィルター」を追い込み猟のごとく誘導していって
通常変換で濾しとった残留物は<未知語カタカナ or 漢語複合語 or接辞複合語>だけになるように文解析の網を張っていこうと目論んでいるのです。
ここまで素性を絞り込めればあとはオールカタカナにするなり、複合語解析をその対象だけ局所的に走らせたりとにかく文法的些末な構造展開に惑わされることなく枠をはめて未知語の扱いに一定の指向性をもたせることができます。
他の日本語IMEには複合語変換のための入力モードを用意してある例もあるのですが私としては通常の変換モードのままで恒常的に未知語解釈ができるような設計を望んでいます。

さらに考察を続けていきます。
残る大きな問題は「さまざまなバリエーションを持つ終助詞」の検知とさきほど後回しにしていた「活用なし用言」の検知であります。
日本語の終助詞は役割語であるとかモダリティ・含意ニュアンス・キャラ語尾などの膨大な変化バリエーションがあるのでこれをもれなく辞書データ化するのは現実的でありません。
一応別口入力パーツにも用法兼務の端くれとして、格助詞でない「が」「か」や形容動詞の活用語尾でない「な」の使用も許容する方針でやっていますが数多の終助詞の前には焼け石に水かも知れません。
ただ、ユーザー定義別口入力に設定出来るようにしてしまえば良いというのは筋が悪いですし、[Ø]キーでセパレートしてしまうやり方も推奨しません。
それはセパレートしてしまうとバラバラになってしまうので一体のフレーズとして変換学習ができなくなってしまうからです。
終助詞の正しい変換に特効薬みたいなものはなく、初回の入力時には[かな][カナ]キーで末尾から修正編集するであるとか粒シフトでの粒度操作からの修正編集などで一度コンピューターにワンフレーズとして途切れさせずに学習・解析させて
二回目以降の学習結果の反映をもってユーザーの望む終助詞の「クセ」みたいなものを咀嚼した成果を出せれば良いのですが…。
これは単に文字列だけを切り張りするような形だけの学習ではなくて、タイプを見定めて助動詞的な終助詞なのか、「~でゲソ」みたいな「である文」との類似系のものなのか「~どす」みたいに「ですオルタナティブ」なのか「~したのじゃ」みたいに「だオルタナティブ」なのか
配置上・機能上のタイプ分けを酌んで変換・チャンク捕捉をおこなえるようにすればよいかと思います。口で言うのは簡単ですけれどこれものちのちの課題になりそうです。

残るは「活用なし用言」ですね。これは
・~みたいな話がチラホラ
・フィギュアがズラリ
・今までで一番まとも
・これは失敬
…のような語尾に活用がない用言なのですが解析上は活用がなければ名詞なのか用言なのか区別がつかないところなので地道に収集していくしかないですね。
名詞なら複合語に溶け込むパーツにもなりますので分解能をあきらめることができますが、叙述は文の命題を締めるところなので述語は述語としてキッチリ"回収"していきたいところなのです。

・戦略見直し必至
・可愛い盛り
・揚げたてホヤホヤ
…のように助詞抜きで接尾辞的に結合しているものもありますがこれは直前の「見直し(というアジェンダの導入)」からの「必至(という結の展開)」という複合物の重心であるとか
「可愛い(形容詞連体形)」からの「盛り(名詞然としてはいるが叙述の向きもある)」で一体感の強い叙述フレーズの形成をみることであるとか
「揚げたてホヤホヤ」とか「追い込みジワリ」みたいなのは(オノマトペのトピックはここでは別として)パーツの叙述感として主語客語からの連結以外のニュアンスづいたところからの連結をこれを叙述フレーズとみなせるかとの構造洞察がはたらくかどうかの試金石となるような語群もあります。
なにより誤解してほしくないのは、「同音語としてカブることの無いようなものまで逐一把握しなければならないものなのか?」という疑問を持つ方もおられるのでしょうが、でにをは別口入力をそなえた変換プロセスにおいては品詞ベースの文解析の重要度は低くなりそのかわり文の成分であるとか機能配置の力学をより重要視していこうというものなのです。
先程の「見直し必至」にしましても「×見直し必死」にならないようにするためにはここが語末の叙述要素なんだなという前提がわかっていて初めて適切な語を選好できる場面というのは頻繁に起きていきます。
ある部分が文章中でどの展開を演じるているのか知ることは大事です。オチに来るのかしょっぱなに位置するのかで衣装を変えるみたいなものであります。
ましてや堅苦しくどんな叙述のタイプなのかを克明に知ることだけに汲々とするのではなく、フレーズの末端に注目してこの文字列ならFix許容できる/この文字列だけ浮いて終端なのはFix違和感がある…これくらいのセンサーは持っておきたいところであります。文法上の厳密性とは別の、末端局所の見切りをどうするかという実際的な問題も大きいのであります。

最後に通常変換においては副詞を最優先に検出する、との方針でありますが
「機能買い物へ行った(○昨日)」、「終了とれなかったな(○収量)」みたいな誤変換を防ぐうえで文の導入部で出てくる語は副詞であったり話題導入のアジェンダ名詞である率が高いのでこれに機先を制する意味でも副詞の検出は欠かせないものとなっています。
しかも副詞/アジェンダ名詞にはてにをはを伴わないで省略されるものやそもそもまるっとひとフレーズ助詞なしで泰然と置かれるいわゆる"ソリチュード"なものが多いのもチャンク把握を困難にさせる要因であるのでまず第一に初動対応が大きな注意点になっていきます。
副詞の後にもずらずらと文は進んでいきますので文解析が始まったばかりのところでつまづくわけにはいかないのであります。


簡単なまとめとしましては、

副詞/アジェンダ名詞の検出>既知語の名詞(主語客語)の検出>活用あり用言(助動詞付随含む)の検出>活用なし用言の検出>…>残留物(未知語カタカナ or 漢語複合語 or接辞複合語)の処理

のような優先順位で構文解析を仕立てていきたいと思っております。
まだおぼろげながらしか輪郭が見えていませんが今記事の収穫としては文解析において品詞前後の接続でみるよりも文全体の中での機能/成分を強く意識したこしらえにしたほうがいい、という方向性が見えてきたことでしょうか。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする