- 処理はまず、文字種で区切る
- 区切りの基準は
- 改行
- 大文字
- 小文字
- 数字
- 記号
- 大文字の後に小文字が続く場合は区切らない
- 逆に小文字の後に大文字の場合は別の単語として区切る
- 例えばHelloWorldという文字列の場合は
- Hの後のeは続き文字として扱い、oの後のWは大文字なので区切る
- 記号は1文字ずつ16進法に変換する
- 日本語の区切り
- 平仮名
- カタカナ
- 漢字
- 区切った後の検索はその区切られた文字列のファイルがあれば開き文字列を探し出力
- まだテストなので検索できるのは
- 名詞
- (名詞)の(名詞)
- (名詞)で(名詞)
- のみ
- ソース
- https://s.mainaddr.com/dat/Cdi.zip
2026年3月7日
文字列を解釈するプログラムのテスト 〜 Cdi (Crude Data Interpretation)
登録:
コメント (Atom)
文字列を解釈するプログラムのテスト 〜 Cdi (Crude Data Interpretation)
処理はまず、文字種で区切る 区切りの基準は 改行 大文字 小文字 数字 記号 大文字の後に小文字が続く場合は区切らない 逆に小文字の後に大文字の場合は別の単語として区切る 例えばHelloWorldという文字列の場合は...
-
2025-09-19
-
※ 配列を0で初期化していない状態で加算してしまってたので修正 long int*型で値がLONG MAXまで達したらポインタ伸ばして1桁増やしていってるだけ なんとなく思いついたので書いてみた ソースは以下のリンク https://s.mainaddr.c...