- 2021年7月30日
- 2023年4月21日
【Elastic】kuromojiプラグインを導入して日本語検索してみる
Elasticsearchは全文検索を強みとした検索エンジンです。 今回は、日本語の全文検索をElasticsearchで実践していきます。Elasticsearchで日本語の全文検索を行うには、kuromojiプラグインとicuプラグインを使用します。 日本語の全文検索は難しい 例えば英語の場合、 […]
Elasticsearchは全文検索を強みとした検索エンジンです。 今回は、日本語の全文検索をElasticsearchで実践していきます。Elasticsearchで日本語の全文検索を行うには、kuromojiプラグインとicuプラグインを使用します。 日本語の全文検索は難しい 例えば英語の場合、 […]
Pythonではスクレイピングができますが、今回はPDFファイルの文字を読み取るプログラムを作成していきます。 テキストの読み取りだけでなく、テキストの座標やページ番号なども併せてCSVファイルとして出力していきます。 PDFが画像ベースの場合(PDF上で文字を選択できない場合)は、こちらの記事を参 […]
今回はWhileを使った繰り返し処理についてです。While文は条件式が真の間だけ処理を繰り返します。 本記事では、While文での条件式の書き方や、処理の流れを見ていきたいと思います。 While文の書き方 While文は以下のような構文で記述します。 while 条件式: 処理1 処理2 […]
Elasticsearchでは、プラグインというパッケージを追加でインストールすることで拡張機能を利用することができます。 今回は、そのプラグインのインストール方法を紹介していきます。 *今回の環境はWindows10です プラグインの種類 Elasticsearchでは豊富な種類のプラグインが用意 […]
Elasticsearchのデータには様々な方法でアクセスできますが、今回はKibanaの画面からアクセスする方法を紹介します。 Kibanaには「開発ツール」という機能があり、そこでクエリ(APIs)を実行することで様々な操作を行うことができます。可能な主な操作は以下の通りです。 インデックスの作 […]
仕事や勉強にとPCで作業する機会が増える今日この頃。 デスクトップでもノートPCでも使うであろう周辺機器が「マウス」だと思います。マウスにも様々な種類があり、どんなマウスを使うかで、作業環境や作業効率が異なってきます。 そんな中、私がオススメするのが「ワイヤレス&トラックボール」のマウスです。 この […]
2020年からテレワークが新たな働き方として本格的に浸透し始め、今では多くの人が自宅等オフィス以外での仕事を経験していると思います。 自宅で仕事をする上でしばしば問題になるのが仕事環境です。自宅は生活空間なので、どうしてもオフィスほど勤務環境が整わない場合が多いと思います。 また、機器の問題もありま […]
以前、一次元のNumpy配列(ndarray)に要素を追加する方法を紹介しました。 今回は、二次元以上のNumpy配列に要素を追加する方法を紹介していきます。 一次元の場合と大きな違いはありませんが、意識しなければいけないことが増えるので、その辺りも見ていきたいと思います。 とりあえずnp.appe […]
NumpyはPythonの計算用ライブラリで、ndarrayは計算に特化した配列です。 以前にndarrayの特徴と基本的な操作方法について紹介しています。 今回は、ndarray(一次元配列)に要素や配列を追加・結合する方法を紹介していきます。 ndarrayに要素を追加しますが、ndarrayに […]
Apple Watchでは文字盤を自分用にカスタマイズすることができます。 高級感のある文字盤からスポーティな文字盤まで多様なセットの中から選べます。さらに、表示させるコンテンツも自分で指定することもできます。 本記事では、Apple Watchでの文字盤の設定方法を紹介します。 記事を参考にカスタ […]