ご無沙汰しております。Alice's Brownyを開発しているものです。
・本スレで指摘されていましたGetTweets.csがすべてのツイートを取得できていない件ですが、これはTwitter側の不具合である可能性があります。
GetTweets.csはTwitterの検索システムを利用してツイートを取得していますが、対象のユーザがユーザ名を変更した場合に、変更前のツイートが検索に反映される場合とされない場合があるようです。
暫定対応としてSeleniumを利用してツイートを取得するGetTweets_Selenium.csを用意しましたのでこちらをご利用ください。
・Chromeの仕様が変わったようでSeleniumを用いるツールでChromeの白いウィンドウが表示されないようになりました。
・Tmboxの保存データについてはユーザやキーワードごとの分類などを行っていますが、未だ新発掘はできていません。
MicrosoftのSpeaker Recognition API(https://azure.microsoft.com/ja-jp/services/cognitive-services/speaker-recognition/)を用いて自動でクッキー☆声優を識別することを検討しています。
しかし全音声が約80万件あり、そこからユーザ毎にまとめる作業を行っても約10万件を処理する必要があります。
Speaker Recognition APIは有料のAPIであり、1000件あたり$9の利用料を支払う必要があるため尻込みしている状況です。
話者認識は現在進行形で研究が続けられているような最先端の技術であることから他のライブラリは簡単に手を出せるものではなさそうです。
とりあえず更に絞り込みを行い件数を減らす予定です。
・多忙のため、大規模な開発は当分できそうにありません。申し訳ありません。