Bangun Agen AI Generator Laporan dengan Nvidia Nemotron di OpenRouter

[ad_1]

Tidak seperti sistem tradisional yang mengikuti jalur yang telah ditentukan, agen AI adalah sistem otonom yang menggunakan model bahasa besar (LLM) untuk membuat keputusan, beradaptasi dengan perubahan persyaratan, dan melakukan penalaran yang kompleks.

Dalam panduan ini untuk lokakarya mandiri untuk membangun agen pembuatan laporan, Anda akan mendapatkan:

  • Memahami empat pertimbangan inti dari setiap agen AI, termasuk Nvidia Nemotron, keluarga model terbuka dengan data dan bobot terbuka.
  • Agen pembuatan dokumen kerja yang dapat meneliti dan menulis laporan.
  • Pengetahuan tentang cara membangun agen menggunakan Langgraph dan OpenRouter.
  • Turnkey, lingkungan pengembangan portabel.
  • Agen khusus Anda sendiri, siap untuk dibagikan sebagai NVIDIA yang dapat diluncurkan.

Panduan video

Video 1. Pelajari Cara Membangun Agen Pembuatan Laporan dengan Nvidia Nemotron Nano

Penyebaran lokakarya

Luncurkan lokakarya sebagai a NVIDIA Brev Launchable:

Gambar dari tombol Deploy NowGambar dari tombol Deploy Now
Gambar 1. Klik tombol 'Deploy Now' untuk menggunakan lokakarya NVIDIA DEVX di cloud

Konfigurasi untuk mengatur rahasia

Untuk mengikuti lokakarya ini, Anda harus mengumpulkan dan mengkonfigurasi beberapa rahasia proyek.

  • Kunci API OpenRouter: Ini memungkinkan akses ke model NVIDIA NEMOTRON NANO 9B V2 melalui OpenRouter.
  • Kunci API yang Tavily: Ini memungkinkan akses ke API Pencarian Web Tavily untuk pencarian web waktu-nyata.

Dengan lingkungan Jupyterlab Anda berjalan, Anda dapat menggunakan Manajer Rahasia ubin di bawah Jalur belajar nvidia devx di peluncur Jupyterlab untuk mengonfigurasi rahasia ini untuk lingkungan pengembangan lokakarya Anda. Verifikasi di tab Log bahwa rahasia telah ditambahkan dengan sukses.

Tangkapan layar dari ubin manajer rahasia di bawah jalur pembelajaran nvidia devxTangkapan layar dari ubin manajer rahasia di bawah jalur pembelajaran nvidia devx
Gambar 2. Gunakan ubin “Rekret Manajer” di bawah bagian Jalur Pembelajaran NVIDIA DEVX untuk mengonfigurasi Rahasia Proyek

Selanjutnya, temukan Jalur belajar nvidia devx Bagian peluncur Jupyterlab. Pilih 1. Pengantar Agen Ubin untuk membuka instruksi lab dan memulai.

Tangkapan layar dari 1. Pengantar Tile AgenTangkapan layar dari 1. Pengantar Tile Agen
Gambar 3. “1. Pengantar Agen” Ubin di jalur pembelajaran NVIDIA DEVX untuk membuka instruksi laboratorium.

Pengantar Arsitektur Agen

Setelah lingkungan lokakarya Anda diatur, bagian pertama memperkenalkan pengembang kepada agen. Sangat penting untuk memahami apa yang membedakan agen dari aplikasi AI yang lebih sederhana sebelum terjun ke implementasi.

Tidak seperti aplikasi tradisional berbasis LLM, agen dapat secara dinamis memilih alat, menggabungkan penalaran yang kompleks, dan menyesuaikan pendekatan analisis mereka berdasarkan situasi yang dihadapi. Pengembang akan belajar tentang empat pertimbangan utama mendasar untuk semua agen:

  • Model: LLM yang berfungsi sebagai otak, memutuskan alat mana yang akan digunakan dan bagaimana merespons.
  • Peralatan: Fungsi yang memungkinkan LLM untuk melakukan tindakan seperti perhitungan matematika, kueri database, atau panggilan API.
  • Memori dan Negara: Informasi yang tersedia untuk LLM selama dan di antara percakapan.
  • Rute: Logika yang menentukan apa yang harus dilakukan agen selanjutnya berdasarkan keadaan saat ini dan keputusan LLM.

Anda akan belajar cara menyatukan komponen-komponen ini untuk membangun agen dasar yang dilengkapi dengan kalkulator pertama Anda code/intro_to_agents.ipynb. Pada akhir latihan ini, Anda akan memiliki agen yang melengkapi yang berikut:

[{'content': 'What is 3 plus 12?', 'role': 'user'},
 {'content': None,
  'role': 'assistant',
  'tool_calls': [{'function': {'arguments': '{"a": 3, "b": 12}', 'name': 'add'},
                  'id': 'chatcmpl-tool-b852128b6bdf4ee29121b88490174799',
                  'type': 'function'}]},
 {'content': '15',
  'name': 'add',
  'role': 'tool',
  'tool_call_id': 'chatcmpl-tool-b852128b6bdf4ee29121b88490174799'},
 {'content': 'The answer is 15.', 'role': 'assistant'}]

Komponen Generasi Laporan

Sisa lokakarya ini berpusat di sekitar membangun sistem agen berlapis-lapis menggunakan Langgraph Dan Nvidia nim diselenggarakan sebagai titik akhir openRouter. Arsitektur ini terdiri dari empat komponen agen yang saling berhubungan, masing -masing menangani aspek spesifik dari proses pembuatan dokumen:

  1. Penelitian awal: Kumpulkan informasi komprehensif tentang topik tersebut.
  2. Perencanaan garis besar: Buat garis besar dokumen terstruktur berdasarkan penelitian.
  3. Penulisan Bagian: Hasilkan konten terperinci untuk setiap bagian dengan penelitian tambahan sesuai kebutuhan.
  4. Kompilasi akhir: Merakit semua bagian menjadi laporan profesional.

Pelajari dan terapkan kode

Sekarang kita memahami konsep -konsepnya, mari selami implementasi teknis. Kami akan mulai dengan pertimbangan dasar yang disebutkan di atas dan membangun ke agen lengkap:

  1. Pilih model
  2. Pilih alat
  3. Membangun peneliti
  4. Membangun penulis
  5. Bangun Agen Terakhir
  6. Kelola dan rute agen

Yayasan: Model

Lokakarya bergantung pada Nvidia mereka Titik akhir untuk model inti yang memberi daya pada agen. NVIDIA NIM memberikan kemampuan inferensi berkinerja tinggi, termasuk:

  • Ikatan Alat: Dukungan asli untuk panggilan fungsi.
  • Output terstruktur: Dukungan bawaan untuk model Pydantic.
  • Operasi Async: Dukungan async/menunggu penuh untuk pemrosesan bersamaan.
  • Keandalan Perusahaan: Infrastruktur inferensi tingkat produksi.

Contoh ini menunjukkan konektor Chatnvidia menggunakan NVIDIA NIM di -host sebagai titik akhir OpenRouter.

from langchain_nvidia_ai_endpoints import ChatNVIDIA

llm = ChatNVIDIA(
    base_url="https://openrouter.ai/api/v1",
    model="nvidia/nemotron-nano-9b-v2:free", 
    api_key=os.getenv("OPENROUTER_API_KEY")
)
llm_with_tools = llm.bind_tools([tools.search_tavily])

Sementara instruksi kualitas yang jelas penting dalam aplikasi berbasis LLM apa pun, mereka sangat penting untuk agen karena mereka menghilangkan ambiguitas dan mengklarifikasi proses pengambilan keputusan. Salah satu contoh dari code/docgen_agent/prompts.py disediakan sebagai berikut:

research_prompt: Final[str] = """
Your goal is to generate targeted web search queries that will gather comprehensive information for writing a technical report section.

Topic for this section:
{topic}

When generating {number_of_queries} search queries, ensure they:
1. Cover different aspects of the topic (e.g., core features, real-world applications, technical architecture)
2. Include specific technical terms related to the topic
3. Target recent information by including year markers where relevant (e.g., "2024")
4. Look for comparisons or differentiators from similar technologies/approaches
5. Search for both official documentation and practical implementation examples

Your queries should be:
- Specific enough to avoid generic results
- Technical enough to capture detailed implementation information
- Diverse enough to cover all aspects of the section plan
- Focused on authoritative sources (documentation, technical blogs, academic papers)"""

Prompt ini menunjukkan beberapa prinsip utama yang dapat diandalkan LLM:

  • Spesifikasi peran: Definisi yang jelas tentang keahlian dan tanggung jawab agen.
  • Dekomposisi tugas: Memecah persyaratan kompleks ke dalam langkah atau kriteria yang dapat ditindaklanjuti.
  • Kekhususan: Referensi Contoh spesifisitas temporal dan sumber otoritatif.
  • Input / output terstruktur: Instruksi spesifik untuk struktur respons yang diinginkan dan struktur input yang diharapkan.

Yayasan: Alat

Kemampuan agen didefinisikan melalui alatnya. Lokakarya ini menggunakan Tavily, API pencarian yang dirancang khusus untuk agen AI, sebagai alat utama untuk pengumpulan informasi.

# imports and constants omitted
@tool(parse_docstring=True)
async def search_tavily(
    queries: list[str],
    topic: Literal["general", "news", "finance"] = "news",
) -> str:
    """Search the web using the Tavily API.

    Args:
        queries: List of queries to search.
        topic: The topic of the provided queries.
          general - General search.
          news - News search.
          finance - Finance search.

    Returns:
        A string of the search results.
    """
    search_jobs = []
    for query in queries:
        search_jobs.append(
            asyncio.create_task(
                tavily_client.search(
                    query,
                    max_results=MAX_RESULTS,
                    include_raw_content=INCLUDE_RAW_CONTENT,
                    topic=topic,
                    days=days,  # type: ignore[arg-type]
                )
            )
        )
    search_docs = await asyncio.gather(*search_jobs)
    return _deduplicate_and_format_sources(
        search_docs,
        max_tokens_per_source=MAX_TOKENS_PER_SOURCE,
        include_raw_content=INCLUDE_RAW_CONTENT,
    )

Keputusan Arsitektur Utama dalam Implementasi Modul Alat meliputi:

  • Operasi Async: Menggunakan `asyncio.gather ()` untuk pencarian bersamaan
  • Deduplikasi: Fungsi pembantu mencegah redundansi dari beberapa pencarian
  • Dokumentasi terstruktur: Google-style Docstrings membantu LLM memahami penggunaan alat

Sekarang kami telah menetapkan pemahaman dasar tentang model dan alat dalam kode, mari kita kumpulkan menjadi agen kerja yang sebenarnya. Kami belum mengeksplorasi pertimbangan manajemen dan perutean negara bagian, tetapi kami akan meninjau kembali nanti setelah kami memiliki komponen agen kami.

Menerapkan peneliti

Komponen peneliti agen mengimplementasikan pola penalaran dan tindakan (Bereaksi)Salah satu arsitektur paling efektif untuk agen yang menggunakan alat. Pola ini menciptakan lingkaran di mana agen berpikir tentang apa yang harus dilakukan, mengambil tindakan, dan kemudian memutuskan langkah selanjutnya berdasarkan hasil. Ini berlanjut sampai agen mengevaluasi bahwa tidak ada lagi tindakan yang diperlukan untuk menyelesaikan tugas.

    Diagram yang menampilkan loop agen bereaksi sederhana     Diagram yang menampilkan loop agen bereaksi sederhana
Gambar 4. Lingkaran bereaksi adalah arsitektur yang efektif untuk agen yang menggunakan alat untuk menyelesaikan suatu tugas

Kode untuk komponen peneliti agen ini diimplementasikan code/docgen_agent/researcher.py dan dapat diuji oleh code/researcher_client.ipynb.

state = ResearcherState(
    topic="Examples of AI agents in various industries.",
    number_of_queries=3,
)
state = await graph.ainvoke(state)

for message in state["messages"]:
    print("ROLE: ", getattr(message, "role", "tool_call"))
    print(message.content[:500] or message.additional_kwargs)
    print("")

Anda juga dapat melihat setiap tindakan yang diambil oleh peneliti selama eksekusi.

INFO:docgen_agent.researcher:Calling model.
INFO:docgen_agent.researcher:Executing tool calls.
INFO:docgen_agent.researcher:Executing tool call: search_tavily
INFO:docgen_agent.tools:Searching the web using the Tavily API
INFO:docgen_agent.tools:Searching for query: Technical architecture of AI agents in healthcare 2024
INFO:docgen_agent.tools:Searching for query: Comparison of machine learning frameworks for AI agents in finance
INFO:docgen_agent.tools:Searching for query: Real-world applications of natural language processing in AI agents for customer service 2024
INFO:httpx:HTTP Request: POST https://api.tavily.com/search "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.tavily.com/search "HTTP/1.1 200 OK"
INFO:httpx:HTTP Request: POST https://api.tavily.com/search "HTTP/1.1 200 OK"
INFO:docgen_agent.researcher:Calling model.

Serta output akhir, termasuk permintaan panggilan alat, output alat, dan pesan akhir merangkum hasilnya.

ROLE:  assistant
{'tool_calls': [{'id': 'chatcmpl-tool-b7185ba8eb3a44259b0bdf930495ece5', 'type': 'function', 'function': {'name': 'search_tavily', 'arguments': '{"queries": ["Technical architecture of AI agents in healthcare 2024", "Comparison of machine learning frameworks for AI agents in finance", "Real-world applications of natural language processing in AI agents for customer service 2024"], "topic": "general"}'}}]}

ROLE:  tool_call
"Sources:\n\nSource AI Agents in Modern Healthcare: From Foundation to Pioneer:\n===\nURL: https://www.preprints.org/manuscript/202503.1352/v1\n===\nMost relevant content from source: T. Guo et al., \"Large language model based multi-agents: A survey of progress and challenges,\" arXiv preprint arXiv:2402.01680, 2024. J. Ruan et al., \"TPTU: Large Language Model-based AI Agents for Task Planning and Tool Usage. | **Partner Agent** | * True healthcare team partners * Generates clinical hypotheses

ROLE:  assistant
Based on the search results, here are some potential search queries that could be used to gather comprehensive information for writing a technical report section on examples of AI agents in various industries:

1. "Technical architecture of AI agents in healthcare 2024"
2. "Comparison of machine learning frameworks for AI agents in finance"
3. "Real-world applications of natural language processing in AI agents for customer service 2024"

Menerapkan penulis

Agen reaksi sederhana sangat kuat, tetapi sering dikombinasikan dengan langkah -langkah tambahan untuk melakukan alur kerja yang lebih rumit. Penulis bagian perlu melakukan penelitian terkait bagian tambahan, tetapi hanya jika diminta. Setelah penelitian yang diperlukan tersedia, ia harus menggunakan penelitian itu untuk menulis bagian tersebut.

Dalam diagram arsitektur yang dimodifikasi, fungsi gating telah ditambahkan sebelum agen bergaya reaksi untuk menentukan apakah diperlukan penelitian tambahan, serta langkah menulis di akhir.

Diagram yang menunjukkan pohon keputusan yang mengarah ke loop agen bereaksi.Diagram yang menunjukkan pohon keputusan yang mengarah ke loop agen bereaksi.
Gambar 5. Loop Agen Bereaksi dengan Penulis Bagian Ditambahkan untuk Melakukan Penelitian Terkait Bagian Tambahan Saat Diminta

Kode untuk komponen peneliti agen ini diimplementasikan code/docgen_agent/author.py dan dapat diuji oleh code/author_client.ipynb.

state = SectionWriterState(
    index=1,
    topic="Examples of AI agents in various industries.",
    section=Section(
        name="Real-World Applications",
        description="Examples of AI agents in various industries",
        research=True,
        content=""
    ),
)

state = await graph.ainvoke(state)
Markdown(state["section"].content)

Anda juga dapat melihat setiap tindakan yang diambil oleh penulis selama eksekusi.

INFO:docgen_agent.author:Researching section: Real-World Applications
INFO:docgen_agent.author:Executing tool calls for section: Real-World Applications
INFO:docgen_agent.author:Executing tool call: search_tavily
INFO:docgen_agent.tools:Searching the web using the Tavily API
INFO:docgen_agent.tools:Searching for query: AI agents in healthcare industry 2024
INFO:docgen_agent.tools:Searching for query: Implementation of AI agents in finance sector 2023
...
INFO:httpx:HTTP Request: POST https://api.tavily.com/search "HTTP/1.1 200 OK"
INFO:docgen_agent.author:Researching section: Real-World Applications
INFO:docgen_agent.author:Writing section: Real-World Applications

Serta output akhir, yang terdiri dari bagian tertulis dalam format Markdown.

## Real-World Applications

AI agents have numerous applications across various industries...

### Healthcare

AI agents in healthcare are revolutionizing patient care and medical innovation. They are being used to automate administrative tasks, enhance diagnostics, and improve workflow efficiency. For instance...

### Finance

AI agents in finance are driving innovation, success, and compliance. They are being used to automate tasks such as data entry, transaction processing, and compliance checks. AI agents are also being used to detect fraud, improve customer service, and provide personalized investment advice. For example...

Menerapkan agen akhir

Dengan menggunakan dua komponen ini, kami sekarang dapat mengumpulkan alur kerja agen generasi dokumen kami. Arsitektur ini adalah yang paling sederhana sejauh ini – alur kerja linier yang meneliti topik, menulis bagian -bagiannya, dan menyusun seluruh laporan yang diselesaikan.

Diagram yang menggambarkan seluruh aliran ujung ke ujung.Diagram yang menggambarkan seluruh aliran ujung ke ujung.
Gambar 6. Alur kerja agen pelaporan yang meneliti suatu topik, menulis bagian, dan menyusun laporan

Kode untuk komponen peneliti agen ini diimplementasikan code/docgen_agent/agent.py dan dapat diuji oleh code/agent_client.ipynb.

state = AgentState(
    topic="The latest developments with AI Agents in 2025.",
    report_structure="This article should be..."
)

state = await graph.ainvoke(state)
Markdown(state["report"])

Anda juga dapat melihat setiap tindakan yang diambil oleh penulis selama eksekusi.

INFO:docgen_agent.agent:Performing initial topic research.
INFO:docgen_agent.researcher:Calling model.
INFO:docgen_agent.researcher:Executing tool calls.
INFO:docgen_agent.researcher:Executing tool call: search_tavily
INFO:docgen_agent.tools:Searching the web using the Tavily API
INFO:docgen_agent.tools:Searching for query: AI Agents 2025 core features
INFO:docgen_agent.tools:Searching for query: Real-world applications of AI Agents in 2025
...
INFO:httpx:HTTP Request: POST https://api.tavily.com/search "HTTP/1.1 200 OK"
INFO:docgen_agent.researcher:Calling model.
INFO:docgen_agent.agent:Calling report planner.
INFO:docgen_agent.agent:Orchestrating the section authoring process.
INFO:docgen_agent.agent:Creating author agent for section: Introduction
INFO:docgen_agent.agent:Creating author agent for section: Autonomous Decision-Making
INFO:docgen_agent.agent:Creating author agent for section: Integration with Physical World
INFO:docgen_agent.agent:Creating author agent for section: Agentic AI Trends
INFO:docgen_agent.agent:Creating author agent for section: AI Agents in Customer Support
INFO:docgen_agent.agent:Creating author agent for section: AI Agents in Healthcare
INFO:docgen_agent.agent:Creating author agent for section: Conclusion
INFO:docgen_agent.agent:Throttling LLM calls.
INFO:docgen_agent.author:Writing section: Introduction
INFO:docgen_agent.author:Researching section: Autonomous Decision-Making
...

Laporan yang diselesaikan akan dihasilkan dalam format Markdown. Disediakan adalah sampel laporan penelitian yang dihasilkan oleh agen ini: output markdown sampel.

Yayasan: Manajemen dan Perutean Negara

Dengan komponen agen yang dibangun, mari kita mundur selangkah dan jelajahi cara menggunakan Langgraph Sebagai kerangka kerja agen untuk manajemen negara maju dan kontrol aliran, menghubungkan ketiga komponen bersama -sama ke dalam sistem AI agen tunggal. Langgraph memberikan beberapa keunggulan utama:

  • Routing bersyarat: Tepi bersyarat memungkinkan kontrol aliran dinamis berdasarkan kondisi runtime, agen yang memungkinkan untuk membuat keputusan cerdas tentang tindakan mereka berikutnya.
  • Kompilasi dan eksekusi grafik: Grafik yang dikompilasi dapat dipanggil secara tidak sinkron, mendukung eksekusi bersamaan dan pola orkestrasi yang kompleks penting untuk sistem multi-agen.

Dalam contoh berikut dari code/docgen_agent/agent.py Kita dapat melihat komponen mana yang sebelumnya kita bangun sesuai dengan node mana, serta tepi yang terhubung, atau rute, output menengah dari satu node ke yang berikutnya.

main_workflow = StateGraph(AgentState)
main_workflow.add_node("topic_research", topic_research)
main_workflow.add_node("report_planner", report_planner)
main_workflow.add_node("section_author_orchestrator", section_author_orchestrator)
main_workflow.add_node("report_author", report_author)

main_workflow.add_edge(START, "topic_research")
main_workflow.add_edge("topic_research", "report_planner")
main_workflow.add_edge("report_planner", "section_author_orchestrator")
main_workflow.add_edge("section_author_orchestrator", "report_author")
main_workflow.add_edge("report_author", END)

Selamat! Dalam berjalan melalui setiap langkah lokakarya pengembang ini, Anda baru saja membangun agen Langgraph Anda sendiri. Uji agen baru Anda menggunakan code/agent_client.ipynb buku catatan.

Ringkasan

Membangun agen AI membutuhkan pemahaman baik fondasi teoretis dan tantangan implementasi praktis. Lokakarya ini menyediakan jalur komprehensif dari konsep dasar ke sistem agen yang kompleks, menekankan pembelajaran langsung dengan alat dan teknik tingkat produksi.

Dengan menyelesaikan lokakarya ini, pengembang mendapatkan pengalaman praktis dengan:

  • Konsep Agen Fundamental: Memahami perbedaan antara alur kerja dan agen cerdas.
  • Manajemen negara: Menerapkan transisi dan kegigihan negara yang kompleks.
  • Integrasi alat: Membuat dan mengelola kemampuan alat eksternal.
  • Tumpukan AI modern: Bekerja dengan Langgraph, Nvidia NIM, dan Tooling Terkait.

Pelajari lebih lanjut

Untuk pembelajaran langsung, tips, dan trik, bergabunglah dengan streaming laboratorium nemotron kami, “Membangun Agen AI untuk Generasi Laporan dengan Nvidia Nemotron di OpenRouter”Pada hari Selasa, 16 September pukul 11 ​​pagi Pt.

Tetap up to date di Agentic AI, Nemotron, dan lainnya dengan berlangganan NVIDIA News, bergabung dengan komunitas, dan mengikuti Nvidia AI di LinkedIn, Instagram, X, dan Facebook. Jelajahi tutorial video yang serba mandiri dan streaming langsung di sini.



[ad_2]

Bangun Agen AI Generator Laporan dengan Nvidia Nemotron di OpenRouter

Leave a Reply

Your email address will not be published. Required fields are marked *