[B! DuckDB] mkusakaのブックマーク

mkusaka id:mkusaka

DuckDBに関するmkusakaのブックマーク (24)

DuckDBでALBのログを集計するClaude Code Skillを作った
mkusaka 2026/01/06
Claude CodeのSkillでDuckDBでALBログ集計。/plugin marketplace add chokkoyamada/duckdb-alb-log-analyzerで導入

AI要約

article

tool

Claude

DuckDB

AWS
リンク
https://x.com/i/status/2007133909671149860
- 1 user
- x.com
- 学び
mkusaka 2026/01/03
DuckDBのAppender APIはINSERTの解析・計画を省き、列指向ストレージへ直接書き込み、リアルタイムデータ投入を高速化します

AI要約

DuckDB

appender

tweet

API

streaming
リンク
DuckDB as a Pipeline: Findyデータ基盤におけるDuckDBの活用事例 - Findy Tech Blog
この記事は「ファインディエンジニア #1 Advent Calendar 2025」の24日目の記事です。沢山のアドベントカレンダー記事が執筆されていますので、年末のお供に是非読んでみてください。 adventar.org はじめにソフトウェアエンジニアの土屋(@shunsock)です。私の所属するデータソリューションチームでは、ファインディ全体のデータ活用を推進するためのデータ基盤を構築しています。今回、我々はデータ基盤のRDSとBigQueryのテーブル同期システム (EL Pipeline) のリプレースを行い、DuckDBを本番導入しました。本稿では、活用に至った経緯と実際に組みこむにあたる課題、および成果を紹介します。はじめにファインディにおけるテーブル同期システムの立ち位置リプレイスの背景補足技術選定 Datastream DuckDB Datastream,
mkusaka 2025/12/30
DuckDB導入でRDS‑BigQuery同期を刷新、1テーブル約30秒→10秒に短縮し、GitHub Actionsで自動化した実装例

AI要約

DuckDB

BigQuery

AWS

GitHub

case-study
リンク
DuckDB をつかってローカルなRAGを実装する
この記事は Ubie Advent Calendar 2025 17日目の記事です。最近Googleが File Search API を公開しました。使い方はとても簡単で、ファイルをアップロードするだけでGeminiから参照してRAGを実現できるようになります。これまでRAGは避けては通れないけど考えることが多くて面倒だったところが、一気に解消しそうです。ただ、自分としてはRAGにあまり手を出してこなかったのでRAGの構築がどれくらい泥臭いのかを知らないなと思いました。そこで、これを機にローカルで動くRAG環境を基礎的な部分から構築してみたので、そこで得た気づきなどを共有しようと思います。作ってみたもの実装した主な機能は以下の通りです。RAGというと何らかの vector store や全文検索エンジンを利用するのが正攻法だと思いますが、今回は分析への利用のしやすさやその拡張性、お
mkusaka 2025/12/23
DuckDBとVSS拡張でベクトル+BM25ハイブリッド検索を実装し、ローカルディレクトリ監視・自動インデックス構築やα=0.75の重み付きRRF統合を提供するRAG入門

AI要約

DuckDB

RAG

LLM

Python

チュートリアル
リンク
https://x.com/trysmr/status/1924769160997044376
- 1 user
- x.com
- 暮らし
mkusaka 2025/12/21
DuckDBで~/.claude/projectsのjsonlを read_jsonで読み込み、SELECT SUM(costUSD) だけで利用料金を集計できる

AI要約

DuckDB

JSONL

Claude

tips
リンク
650GB of Data (Delta Lake on S3). Polars vs DuckDB vs Daft vs Spark.
I recently tried to light the tinder for what I hoped would be a revolt — the Single Node Rebellion — but, of course, it sputtered out immediately. Truth be told, it was one of the most popular articles I’ve written about in some time, purely based on the stats. The fact that I even sold t-shirts, tells me I have born a few acolytes into this troubled Lake House world. Without rehashing the entire
mkusaka 2025/11/17
S3上のDelta Lake 650GBを32GB/16CPU単一ノードで検証。Polars12分、DuckDB16分、Daft50分、PySpark1時間超。

AI要約

Delta Lake

Polars

DuckDB

Daft

benchmarks
リンク
『DuckDB実践入門』が出版されます
『DuckDB実践入門』が出版されます 2025-08-19 私が翻訳した『DuckDB in Action』の訳書『DuckDB実践入門 PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで』が出版される運びとなりました。レビューに参加してくださった皆様 @snoozer05 @kei_s @ktou @hmsk @tmaeda 、編集を担当いただきました石橋克隆様、お力添えくださいましたすべての皆様に感謝します。 DuckDB実践入門　PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで (impress top gear) | Mark Needham, Michael Hunger, Michael Simons |本 | 通販 | Amazon DuckDB実践入門　PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで -
mkusaka 2025/08/20
翻訳版『DuckDB実践入門 PCで使える高速で快適なデータ分析用DB―基本からエコシステム活用まで』が出版、SQLやPython連携、WebAssembly実行まで網羅

AI要約

DuckDB

書籍

入門

release
リンク
Akamai Cloud Day 2025
2025 年 9 月 24 日 (水) に行われる Akamai Cloud Day 2025 Japan というイベントに登壇します。話す内容は Akamai Cloud へ以降してコストを削減した話を中心に現時点での Akamai Cloud の不満などを忖度せずに話をするので興味がある方は参加してみてください。忖度せずに話します。なんとなくの目次Akamai Cloud への移行移行して 1 年経過可視化外形監視で Fluent bit と VictoriaMetrics と Tailscale と Grafana を使っている話商用提供している自社 Erlang/OTP で書かれた分散システムの運用Raft と Plumtree の話Placement Groups とか VLAN とか VPC とかの話オブジェクトストレージと DuckDB / DuckDB-Wasm でコスト
mkusaka 2025/07/30
Akamai Cloud移行後のコスト削減とFluentbit・VictoriaMetrics・Grafanaでの可視化、DuckDB活用を率直に語ります。

AI要約

Akamai

講演

コスト削減

可視化

DuckDB

ストレージ

VPU
リンク
uPlot でほしいグラフをつくる
リアルタイム配信の世界は、リアルタイムかつ 1 秒単位で沢山の種類、そして大量の統計情報が欲しい。ということで、ブラウザで軽量で大量のグラフを表示したいし、リアルタイムに描画したい。さらにすぐに何万という数値になる。という課題を色々実現したかったので、Claude Code の力を借りて uPlot を利用して、リアルタイムな統計情報をグラフにする仕組みを作った。 uPlot は Grafana に採用されている超軽量なグラフ作成ツールで、かなり細かいカスタマイズができ、React にもサクサクっと組み込める。上のグラフは chrome://webrtc-internals で利用されているグラフを意識した。 chrome://webrtc-internals で取得できるグラフ、1 映像でこれ。React コンポーネント化したので、好き放題にグラフが作れるようになった。グラフを作の本
mkusaka 2025/07/25
Claude Codeで生成し、Reactに組み込めるGrafana採用の超軽量uPlotでリアルタイム統計を可視化、DuckDB‑Wasmに永続保存

AI要約

uPlot

React

DuckDB

Wasm

article
リンク
Testing Out DuckDB's Full Text Search Extension
mkusaka 2025/07/22
DuckDBのSQLだけで実装されたFTSで、PRAGMA create_fts_indexで全列をインデックスし、クエリは0.5〜1.3秒で処理

AI要約

article

DuckDB

SQL

FTS

benchmark
リンク
データ基盤なAWS SecurityLakeに対するSIEMクエリエンジンをDuckDBにするとサクサクで楽しい話 - LayerX エンジニアブログ
ドーモ、読者のミナ=サン、LayerX Fintech事業部（三井物産デジタル・アセットマネジメント（MDM）に出向）で、@ken5scalです。久しぶりのAmazon SecurityLakeとログ系のブログです。セキュリティにおいても、紀元前よりサーバー、ネットワーク機器、アプリケーションなどから出力されるログを一元的に収集し、監視や分析を行うことで、インシデントの早期発見や対応が可能になることはよく知られています。その代表的なソリューションが、そう、皆様よくご存じのSIEMです。当社では、従来のSIEM（DataDog SIEM）に加え、データエンジニアリング的なアプローチにチャレンジ、より強力なデータ基盤を用いた検知エンジンを目指しデータレイクハウスであるAWS SecurityLakeを採用しました。こういった従来のSIEMにおける課題や経緯については、下記のブログをご参照
mkusaka 2025/07/03
Amazon SecurityLake上でSIEMのクエリをDuckDBに置き換え、DataDog SIEMより高速・低コストでログ分析できる実践例と設定手順を紹介

AI要約

article

AWS

SIEM

DuckDB

データ基盤
リンク
Claude Codeの会話ログをDuckDBで分析して自分の仕事スタイルを改善する方法 - yasuhisa's blog
3行まとめはじめに Claude Codeのログ保存機能とその特徴ログ分析の活用例音声入力の課題と英語プロンプトの活用 DuckDBを用いた分析アプローチスキーマ情報の重要性とログ分析の活用ログの長期保存設定まとめ 3行まとめ Claude Codeの会話ログはJSONL形式で保存されており、DuckDBを使って日次の利用状況や音声入力の課題などを分析できる英語プロンプトの学習効率化やエラーパターンの特定など、自分の仕事の仕方を改善するための実践的な活用方法がある JSONLファイルのスキーマ情報を整理することで、Claude Codeがクエリを書く際の精度が向上するはじめに Claude Codeは非常に強力なツールで、これ自体は別のブログで書く予定ですが、もはやこれなしでコードを書けないほど便利に使っています。今回は、そのClaude Codeとの会話ログを分析すること
mkusaka 2025/06/15
AI要約

ClaudeCode

DuckDB

BigQuery

dbt

article
リンク
Using DuckDB in Streamlit
- 1 user
- duckdb.org
- 学び
mkusaka 2025/05/24
オランダ鉄道データでDuckDBのPython APIとStreamlitキャッシュを活用し、PlotlyヒートマップとFoliumでインタラクティブ地図作成手順を紹介

AI要約

DuckDB

streamlit

Python

article
リンク
Query Engines: Gatekeepers of the Parquet File Format
The Apache® Parquet™ Format Apache Parquet is a popular, free, open-source, column-oriented data storage format. Whereas database systems typically load data from formats such as CSV and JSON into database tables before analyzing them, Parquet is designed to be efficiently queried directly. Parquet considers that users often only want to read some of the data, not all of it. To accommodate this, P
mkusaka 2025/05/16
AI要約

article

DuckDB

Parquet

compress

encodings

perf
リンク
The DuckDB Local UI
TL;DR: The DuckDB team and MotherDuck are excited to announce the release of a local UI for DuckDB shipped as part of the ui extension. The DuckDB project was built to make it simple to leverage modern database techno logy. DuckDB can be used from many popular languages and runs on a wide variety of platforms. The included Command Line Interface (CLI) provides a convenient way to interactively run
mkusaka 2025/05/15
リンク
ブラウザでオフライン日本語インスタント全文検索を実現する
DuckDB の FTS (Full Text Search) 拡張と Lindera を利用する事で、日本語全文検索を実現できますが、DuckDB-Wasm と Lindera-Wasm を利用する事でブラウザで日本語全文検索を実現できます。Wasm なので完全オフラインで、利用できます。さらに、クライアントのリソースということもあり一文字ずつ入力された値に対して Lindera-Wasm で形態素解析して、SQL を実行することでインスタント検索も実現できます。 DuckDB-Wasm (FTS 拡張) + Lindera-Wasm 技術的には特に難しいことはしておらず、DuckDB-Wasm の FTS 拡張に Lindera-Wasm で形態素解析した結果を引数として渡して実行しているだけです。デモサイトを用意しておきました、もし良ければ試してみてください。 DuckDB-Wa
mkusaka 2025/04/29
AI要約

チュートリアル

DuckDB

Wasm

全文検索
リンク
Instant SQL is here: Speedrun ad-hoc queries as you type - MotherDuck Blog
Today, we’re releasing Instant SQL, a new way to write SQL that updates your result set as you type to expedite query building and debugging – all with zero-latency, no run button required. Instant SQL is now available in MotherDuck and the DuckDB Local UI. We built Instant SQL for a simple reason: writing SQL is still too tedious and slow. Not because of the language itself, but because the way w
mkusaka 2025/04/28
Instant SQLは入力中にリアルタイムでクエリ結果を返し、プレビューで利用可能。DuckDB Local UIに統合、読了時間は約8分。

AI要約

duckdb

SQL

tool

article

snippets
リンク
DuckDB でハイブリッド検索
DuckDB を利用してベクトル検索と日本語全文検索の両方を同時に利用できます。さらにこれらの結果をマージして Reranking を行うことでハイブリッド検索をサクサクっと実現する事ができます。 Rerankerどうやらベクトル検索した結果と日本語全文検索した結果をマージして、クエリーとマージ結果を再度ランキング付けする仕組みのようです。ここでは参考にした記事を共有する程度にしておきます。日本語最高性能のRerankerをリリース / そもそも Reranker とは? - A Day in the Lifeリランキングモデルによる RAG の日本語検索精度の向上 - NVIDIA 技術ブログ今回は Reranker に hotchpotch/japanese-reranker-cross-encoder-large-v1 を利用しました。以下は参考コードです。 [projec
mkusaka 2025/04/26
DuckDBでベクトル検索と日本語全文検索を同時実行し、hotchpotch/japanese-reranker-cross-encoder-large-v1でリランク付けしハイブリッド検索を実現。

AI要約

DuckDB

ハイブリッド

検索

解説

SQL
リンク
DuckDB で日本語全文検索
DuckDB-VSS と PLaMo-Embedding-1B を利用することで、ベクトル検索を実現できますが、DuckDB-FTS (Full-Text Search) と形態素解析ライブラリである Lindera を組み合わせて日本語全文検索を実現できます。 DuckDB-FTS + LinderaDuckDB の全文検索拡張は日本語には対応していないないのですが、スペース区切りでトークン化することで、日本語の全文検索を利用する事が出来ます。トークン化には Meilisearch にも利用されている信頼と安心の Lindera を利用することにしました。今回この参考コードを Lindera の作者であり検索の専門家でもある Minoru OSUKA 氏にレビューいただきました。本当にありがとうございます。以下は参考コードです。 [project] name = "duckdb-ft
mkusaka 2025/04/26
DuckDB-FTS と Lindera を組み合わせ、Python で日本語全文検索を実装し、id_sequence と BM25 検索例を含むサンプルコードを紹介

AI要約

DuckDB

FTS

Lindera

日本語

全文検索

解説
リンク
Vector Similarity Search Extension
Installation Documentation Getting Started Connect Data Import JSON Files Multiple Files Parquet Files Partitioning Appender INSERT Statements Client APIs C++ CLI Dart Go Java (JDBC) Julia Node.js (Deprecated) Node.js (Neo) ODBC Python R Rust Swift Wasm SQL Query Syntax Data Types Expressions Functions Constraints Indexes Meta Queries DuckDB's SQL Dialect Samples Configuration Extensions Overview
mkusaka 2025/04/08
VSS は HNSW ベースのベクトル検索拡張で、DuckDB の固定長 ARRAY 型にインデックスを作成し高速近傍検索が可能です。

AI要約

DuckDB

VSS

vecsearch

duckdb-ext

benchmark
リンク
1 2 次のページ