s3labの記事一覧

Apple

HealthKitアプリSwiftコードの紹介(5) – SwiftUIによるビューの実装

MyAppクラス:WindowGroupによるメインビューの定義ここからはSwiftUIによるビューのコードを説明していきます。SwiftUIは、Appleが提供するモダンなUIフレームワークであり、Swift言語でiOS、macOS、watchOS、tvOSアプリケーションを構築するための手段です。SwiftUIでは、状態駆動型のUIを構築し、シンプルで直感的な構文を使用してアプリケーションのビューを定義します。このコードは、SwiftUIのアプリケーションを定義しています。MyApp は App プロトコルを準拠しており、アプリケーションのエントリーポイントとなります。import SwiftUIimport Swinject@mainstruct MyApp: App { @AppStorage("isDarkMode") var isDarkMode: Bool = true // inject into SwiftUI life-cycle via adaptor !!! @UIApplicatio

AI

OpenAIが提供する音声認識オープンソースWhisperとは(5)

ソースを確認するtranscribe関数の定義def transcribe( model: "Whisper", audio: Union, *, verbose: Optional = None, temperature: Union = (0.0, 0.2, 0.4, 0.6, 0.8, 1.0), compression_ratio_threshold: Optional = 2.4, logprob_threshold: Optional = -1.0, no_speech_threshold: Optional = 0.6, condition_on_previous_text: bool = True, initial_prompt: Optional = None, word_timestamps: bool = False, prepend_punctuations: str = "\"'“¿([{-&quot

AI

OpenAIが提供する音声認識オープンソースWhisperとは(4)

whisperのデバッグ環境構築whisperのソースコードをチェックアウトするgit clone https://github.com/openai/whisper.gitcd whispertest.pyの作成import sysfrom whisper.transcribe import cliif __name__ == '__main__': sys.exit(cli())test.pyの実行python test.py sample.mp4 --language Englishtranscribe.pydef cli():・・・ model = load_model(model_name, device=device, download_root=model_dir)・・・ソースを確認するload_model関数を読むデフォルト時の引数は、model_name=small, device=cpu, download_root=Noneが使用さ

AI

OpenAIが提供する音声認識オープンソースWhisperとは(3)

transcribe関数の確認def transcribe( model: "Whisper", audio: Union, *, verbose: Optional = None, temperature: Union = (0.0, 0.2, 0.4, 0.6, 0.8, 1.0), compression_ratio_threshold: Optional = 2.4, logprob_threshold: Optional = -1.0, no_speech_threshold: Optional = 0.6, condition_on_previous_text: bool = True, initial_prompt: Optional = None, word_timestamps: bool = False, prepend_punctuations: str = "\"'“¿([{-", appen

AI

OpenAIが提供する音声認識オープンソースWhisperとは(2)

whisperコマンド実行時のエントリーポイントの確認whisperはpipでインストールする設計なので、whisperのsetup.pyファイル内のentry_pointsを確認する。コマンドラインからwhisperコマンドを実行すると、whisper.transcribe:cliが呼び出されることが確認できる。setup(・・・ entry_points={ "console_scripts": , },・・・)エントリポイント whisper.transcribe:cli のコード確認def cli(): from . import available_models def valid_model_name(name): if name in available_models() or os.path.exists(name): return name raise ValueError(

AI

OpenAIが提供する音声認識オープンソースWhisperとは(1)

whisperとは?Whisperは汎用音声認識モデルです。多様なオーディオの大規模なデータセットで訓練されており、マルチタスクモデルでもあり、多言語音声認識、音声翻訳、言語識別などの機能を実行できます。ChatGPTで有名なOpenAIがMITライセンスの下にオープンソースとして公開しています。「Whisperアーキテクチャは、エンコーダーデコーダーTransformerとして実装されたシンプルなエンドツーエンドのアプローチです。入力オーディオは30秒のチャンクに分割され、対数メルスペクトログラムに変換され、それからエンコーダーに渡されます。デコーダーは、特殊トークンと組み合わされた対応するテキストキャプションを予測するようにトレーニングされ、この特殊トークンは、単一モデルが言語識別、フレーズレベルのタイムスタンプ、多言語音声の転記、および英語への音声翻訳などのタスクを実行するように導きます。他の既存のアプローチは、より小規模で、より密にペアされた音声テキストのトレーニングデータセットを使用したり、広範囲ながら非監視の音声事前トレーニングを使用したりすること

Apple

HealthKitアプリSwiftコードの紹介(4) – HealthKitデータの管理

HealthKitデータの管理と同期を行うためのクラスこのコードは、HealthKitデータの管理と同期を行うためのクラス HealthKitStore とそれに関連するプロトコル HealthKitStoreProtocol を定義しています。このクラスは、HealthKitフレームワークを使用してユーザーのヘルスデータを読み取り、アップロードするための機能を提供します。import Foundationimport HealthKitimport UIKitimport Combineprotocol HealthKitStoreProtocol { func authorizeHealthKit(completion: @escaping () -> Void) func startObservingDataChanges(queue: DispatchQueue?, isBackgroundTask: Bool, completion: @escaping () -> Void) func updateCharac

Apple

HealthKitアプリSwiftコードの紹介(3) – HealthKitデータの監視

HealthKitの心電図データと数量データの監視次のstartObservingDataChangesメソッドは、健康データの変更を監視し、データをサーバーにアップロードするための非同期処理を開始するためのものです。このメソッドは、指定されたクロージャーの完了時に呼び出される非同期タスクを開始します。シーケンス図以下に、本投稿で説明する部分のシーケンス図を示します。まず、self.queue.asyncを使用して、データ処理を非同期で実行するためにディスパッチキューに渡します。これにより、メソッドの呼び出し元のスレッドがブロックされることなく、バックグラウンドで処理が行われます。その後、HealthKitStore.healthKitActivityTypeの各サンプルタイプに対して、処理を開始します。サンプルタイプごとに、最新の健康データサンプルを取得し、データを適切な形式に変換して処理します。例えば、心電図の場合はECGUploadDataModelに変換し、その他の健康データの場合はHealthKitQualityUploadD

Apple

HealthKitアプリSwiftコードの紹介(2) – バックグラウンドタスクサービスの実装

バックグラウンドタスクサービスの実装このコードは、バックグラウンドでHealthKitからヘルスデータを読み出すためのサービスを実装しています。BackgroundTaskServiceProtocolプロトコルを定義し、バックグラウンドタスクの登録や処理、データの取得などのメソッドを宣言しています。バックグラウンドでHealthKitからヘルスデータを読み出すSwiftコードの紹介(1)と同じ以下のシーケンス図を用いて説明していきます。BackgroundTaskServiceクラスは、BackgroundTaskServiceProtocolプロトコルを採用し、実装しています。このクラスは、ユーザーのデフォルト設定、Auth0サービス、データ同期API、ローカルデータベースなどの依存性を受け取ります。また、バックグラウンドで実行されるタスクの管理や、HealthKitからのデータ取得などを行います。import BackgroundTasksimport UserNotificationsimport HealthKitprotoc

Apple

HealthKitアプリSwiftコードの紹介(1) – DIコンテナへのサービス登録

はじめにこの投稿では、現在Swiftで開発中のiPhoneアプリの設計やコードの一部を紹介していきます。このアプリは、Apple WatchやiPhoneでHealthKitのデータベースに保存されたヘルスデータをサーバーに送信することが主な目的です。アプリがバックグラウンド中でも定期的にデータを送信することを目標にしています。また、アプリ上で簡単なグラフの確認もできるように実装しています。シーケンス図今回説明する部分のクラスの関係がわかりやすいようにシーケンス図を記載しました。シングルトンとしてのコンテナの実装このコードは、SwiftのDIコンテナライブラリであるSwinjectを使用して依存性注入を行うためのコンテナを定義しています。まず、Containerのインスタンスを生成し、Assemblerを使用してそのコンテナに複数のアセンブリを適用します。各アセンブリは、特定の機能や機能グループの依存関係を登録します。例えば、RepositoryAssemblyはリポジトリの依存関係を、MainNaviAssemblyはメインナビゲーシ