2026年3月7日

文字列を解釈するプログラムのテスト 〜 Cdi (Crude Data Interpretation)

  •  
  • 処理はまず、文字種で区切る 
  • 区切りの基準は 
  •  
  • 改行 
  • 大文字 
  • 小文字 
  • 数字 
  • 記号 
  •  
  • 大文字の後に小文字が続く場合は区切らない 
  • 逆に小文字の後に大文字の場合は別の単語として区切る 
  •  
  • 例えばHelloWorldという文字列の場合は 
  • Hの後のeは続き文字として扱い、oの後のWは大文字なので区切る 
  •  
  • 記号は1文字ずつ16進法に変換する 
  •  
  • 日本語の区切り 
  •  
  • 平仮名 
  • カタカナ 
  • 漢字 
  •  
  • 区切った後の検索はその区切られた文字列のファイルがあれば開き文字列を探し出力 
  •  
  • まだテストなので検索できるのは 
  • 名詞 
  • (名詞)の(名詞) 
  • (名詞)で(名詞) 
  • のみ 
  •  
  • ソース
  • https://s.mainaddr.com/dat/Cdi.zip

0 件のコメント:

コメントを投稿

文字列を解釈するプログラムのテスト 〜 Cdi (Crude Data Interpretation)

  処理はまず、文字種で区切る  区切りの基準は    改行  大文字  小文字  数字  記号    大文字の後に小文字が続く場合は区切らない  逆に小文字の後に大文字の場合は別の単語として区切る    例えばHelloWorldという文字列の場合は...