ねこでじ(Nekodigi)

Nekodigi’s diary

学習中の気づきをまとめています。応援よろしくお願いします

人工知能を使って手を使わずに楽譜を自動めくり!【Python】OpenCV×Pyautogui

f:id:Nekodigi:20211028212214p:plain

今回は、手が塞がっているときに楽譜(PDF)のページをめくれるプログラムを作りました。

左右の矢印キーの信号を送って操作しているので、PDFの楽譜以外にもスライドショーなど、矢印キーが反応するページならなんでもめくることができます。

高速で動く顔認識システムなので、低スペックでも動作します。

インストール

まず初めに、Python、Pipをインストールしておいてください。

次に二つのライブラリをインストールします。

pip install pyautogui
pip install opencv-python

Githubから今回のプログラムをダウンロードします。
github.com

最後にターミナルを開いてcdコマンドでFacePDF.pyが入っているフォルダまで移動してください。

python FacePDF.py

で実行してください。
時間がかかる場合は少し待ってみてください。

使い方

上記の手順で、画像認識プログラムを開きます。

青い枠が表示されていたらうまく認識できています。

うまくいかない場合は、部屋を明るくしたり、顔が真っ直ぐきれいに映るようにしてください。

顔を、左・右に動かして、映像が一時的に止まったら、準備は完了です。顔をまっすぐにしたまま体全体を左右に動かすと反応しやすいです。

PDFファイルを開いてください、右に顔を動かしたら次のページに、左に顔を動かしたら前のページに戻るはずです。