AssemblyAI 推出用于高级音频转录和分析的 C# .NET SDK

路易莎·克劳福德
2024 年 9 月 3 日 05:37

AssemblyAI 发布了 C# .NET SDK，使开发人员能够转录和分析音频，并使用 LeMUR 应用 LLM。

AssemblyAI 宣布发布其新的 C# .NET SDK，旨在为使用 C#、VB.NET 和 F# 等 .NET 语言的开发人员提供音频转录和分析功能。据 AssemblyAI 称，该 SDK 旨在简化 AssemblyAI 高级语音 AI 模型的使用。

主要特点和目标

SDK 的开发考虑了以下几个主要目标：

使用惯用的 C# 为所有 AssemblyAI 模型和功能提供直观的界面。

确保与多种框架兼容，包括.NET 6.0、.NET Framework 4.6.2 以及 .NET Standard 2.0 及以上版本。

最小化依赖关系以防止版本冲突和绑定重定向的需要。

转录音频文件

SDK 的主要功能之一是音频转录。开发人员可以异步或实时转录音频文件。以下是如何转录音频文件的示例：

using AssemblyAI;
using AssemblyAI.Transcripts;

var client = new AssemblyAIClient("YOUR_API_KEY");

var transcript = await client.Transcripts.TranscribeAsync(new TranscriptParams
{
    AudioUrl = "
});

transcript.EnsureStatusCompleted();

Console.WriteLine(transcript.Text);

对于本地文件，可以使用类似的代码来实现转录。

await using var stream = new FileStream("./nbc.mp3", FileMode.Open);
var transcript = await client.Transcripts.TranscribeAsync(
    stream,
    new TranscriptOptionalParams
    {
        LanguageCode = TranscriptLanguageCode.EnUs
    }
);

transcript.EnsureStatusCompleted();

Console.WriteLine(transcript.Text);

实时音频转录

SDK 还支持使用流式语音转文本进行实时音频转录。此功能对于需要立即处理音频数据的应用程序特别有用。

using AssemblyAI.Realtime;

await using var transcriber = new RealtimeTranscriber(new RealtimeTranscriberOptions
{
    ApiKey = "YOUR_API_KEY",
    SampleRate = 16_000
});

transcriber.PartialTranscriptReceived.Subscribe(transcript =>
{
    Console.WriteLine($"Partial: {transcript.Text}");
});
transcriber.FinalTranscriptReceived.Subscribe(transcript =>
{
    Console.WriteLine($"Final: {transcript.Text}");
});

await transcriber.ConnectAsync();

// Pseudocode for getting audio from a microphone for example
GetAudio(async (chunk) => await transcriber.SendAudioAsync(chunk));

await transcriber.CloseAsync();

利用 LeMUR 申请法学硕士

SDK 与 LeMUR 集成，允许开发人员在语音数据上构建大型语言模型 (LLM) 应用程序。以下是示例：

var lemurTaskParams = new LemurTaskParams
{
    Prompt = "Provide a brief summary of the transcript.",
    TranscriptIds = (transcript.Id),
    FinalModel = LemurModel.AnthropicClaude3_5_Sonnet
};

var response = await client.Lemur.TaskAsync(lemurTaskParams);

Console.WriteLine(response.Response);

音频智能模型

此外，该 SDK 还内置对音频智能模型的支持，可实现情感分析和其他高级功能。

var transcript = await client.Transcripts.TranscribeAsync(new TranscriptParams
{
    AudioUrl = "
    SentimentAnalysis = true
});

foreach (var result in transcript.SentimentAnalysisResults!)
{
    Console.WriteLine(result.Text);
    Console.WriteLine(result.Sentiment); // POSITIVE, NEUTRAL, or NEGATIVE
    Console.WriteLine(result.Confidence);
    Console.WriteLine($"Timestamp: {result.Start} - {result.End}");
}

欲了解更多信息，请访问 AssemblyAI 官方博客。

图片来源：Shutterstock

（标签翻译）人工智能（t）加密（t）区块链（t）新闻

关键词：AI,crypto,blockchain,news

AssemblyAI 推出用于高级音频转录和分析的 C# .NET SDK

主要特点和目标

转录音频文件

实时音频转录

利用 LeMUR 申请法学硕士

音频智能模型

Related Posts

视频盗贼在切穿芝加哥商店的墙壁后偷走了超过100万美元的珠宝

市场每周前景 – 随着贸易不确定性持续存在的美国通货膨胀

由彭博社提供支持的卡塔尔经济论坛的最佳

雷诺集团（Renault Group）与下一代机器人技术领导者Wandercraft结束了战略合作伙伴关系

埃隆·穆斯克（Elon Musk

这是华尔街对特朗普·穆斯克的仇恨的反应

iCe说：NPR