A library for finding the most similar word from a list of words, supporting Japanese (including kanji). / 最も似た単語を単語群から検索する日本語(漢字含む)対応のライブラリ
npm install closewordsworker_threads, the processing speed is slightly improved compared to the standard.
worker_threads を採用しているため、標準より少しは処理速度は改善されています。
js
const { closeWords } = require('closewords');
(async () => {
const word = '東京';
const candidates = ['東京', 'とっこう', '東きょう', 'とう京', 'とうきょう', 'とーきょー'];
try {
const result = await closeWords(word, candidates);
console.log('結果:', result);
// raw: true
const resultWithScores = await closeWords(word, candidates, true);
console.log('スコアを含む結果:', resultWithScores);
} catch (error) {
console.error('Error:', error);
}
})();
`
$3
`
結果: [ '東京' ]
スコアを含む結果: [
{ word: '東京', score: 1 },
{ word: 'とう京', score: 0.6933333333333332 },
{ word: 'とうきょう', score: 0.48999999999999994 },
{ word: '東きょう', score: 0.468560606060606 },
{ word: 'とっこう', score: 0.4308888888888888 },
{ word: 'とーきょー', score: 0.41533333333333333 }
]
`
Change Log
$3
Improved Hepburn-style completion.
Format code.
ヘボン式補完を改善しました。
コードをフォーマットしました。
$3
word.pronounce and pronounce in candidates[] are completed Hepburn-style.
word.pronounce と candidates[] 内の pronounce をヘボン式で補完するようにしました。
$3
Fixed bugs.
バグを修正しました。
$3
Fixed score calculation.
スコア計算方法を修正しました。
$3
Fixed score calculation.
スコア計算方法を修正しました。
$3
Fixed README.
Fixed the issue that only a string could be specified in word.
Fixed the issue that word.pronounce was ignored.
Fixed the issue that non-alphabet could be specified for word.pronounce and pronounce in candidates[].
word.pronounce and pronounce in candidates[] are now optional.
Fixed a few pther bugs.
README を修正しました。
word に文字列以外指定できない問題を修正しました。
word.pronounce が無視される問題を修正しました。
word.pronounce と candidates[] 内の pronounce にアルファベット以外を指定できる問題を修正しました。
word.pronounce と candidates[] 内の pronounce を任意にしました。
その他数件のバグを修正しました。
$3
Added a way to specify the pronunciation of words.
単語の発音を指定する方法を追加しました。
$3
Introduced fast-levenshtein and fixed score calculation. The similarity of the original strings is also evaluated.
fast-levenshtein を導入し、スコア計算方法を修正しました。元の文字列の一致度も評価されるようになりました。
$3
Introduced jaro-winkler and optimized.
jaro-winkler` を導入し、最適化しました。