AI 뉴스

매일 새 소식

Claude·GPT·AI 업계 흐름 한 줄 요약

코리가 환하게 웃는 모습
매일 오전 9시 자동 업데이트
2026-06-20· 3
AI 자동 초안

Anthropic, Claude Code SDK 정식 GA—에이전트 워크플로 직접 빌드 가능

Anthropic이 Claude Code의 핵심 에이전트 기능을 외부 애플리케이션에 직접 내장할 수 있는 Claude Code SDK를 정식 출시했다. 개발자는 파일 읽기·쓰기, 터미널 실행, 웹 검색 등 내장 도구를 자신의 파이프라인에 그대로 활용하거나 커스텀 툴을 추가해 독자적인 코딩 에이전트를 구성할 수 있다. 기존 CLI 단독 사용 대비 자동화 통합 범위가 크게 확장되어 CI/CD, 사내 개발 포털, 코드 리뷰 봇 등 다양한 B2B 시나리오에 적용이 가능해졌다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

anthropic claude-code sdk
4분· Anthropic 공식 블로그
AI 자동 초안

OpenAI, Codex 클라우드 샌드박스 정식 GA—격리 환경서 코드 자율 실행

OpenAI가 Codex 에이전트가 클라우드 격리 샌드박스 내에서 코드를 직접 작성·실행·테스트·수정하는 전 과정을 자율 수행하는 Codex 클라우드 샌드박스를 정식 GA(General Availability)로 전환했다. 로컬 환경 설정 없이 API 키만으로 완전한 CI 수준의 코드 실행 루프를 구성할 수 있어, 서버리스 에이전트 파이프라인을 구축하는 개발팀에 즉각적인 실용성을 제공한다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

openai codex developer-tools
4분· OpenAI Platform Documentation
AI 자동 초안

Anthropic, Claude Opus 4 시스템 프롬프트 캐싱 정식 지원—긴 컨텍스트 반복 호출 최적화

Anthropic이 Claude Opus 4 모델에 대해 최대 200K 토큰 범위의 시스템 프롬프트 캐싱을 정식 지원하기 시작했다. 대형 코드베이스나 문서를 반복적으로 참조하는 에이전트 워크플로에서 입력 토큰 비용을 최대 90%까지 절감할 수 있어, 장문 컨텍스트를 활용하는 한국 개발자에게 실질적인 운영 비용 개선이 기대된다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

anthropic claude cost-optimization
4분· Anthropic Official Documentation
2026-06-19· 3
AI 자동 초안

Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대량 처리 비용 50% 추가 절감

Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 기존 실시간 API 대비 최대 50% 추가 할인 요금을 적용한다고 공식 발표했다. 비동기 대량 요청 처리가 필요한 데이터 파이프라인·콘텐츠 자동화 워크플로에서 운영 비용을 대폭 낮출 수 있어 한국 개발자·크리에이터에게 실질적인 영향을 준다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

anthropic api cost-optimization
4분· Anthropic Official Documentation
AI 자동 초안

Claude Code, 병렬 서브에이전트 실행 기능 베타 공개

Anthropic이 Claude Code에 복수의 서브에이전트를 동시에 스폰(spawn)해 독립 작업을 병렬 처리하는 기능을 베타로 공개했다. 테스트 작성·린트 수정·문서 업데이트 같은 독립적 태스크를 분리 실행해 전체 소요 시간을 최대 60% 단축할 수 있으며, 크리에이터·개발자 모두 복잡한 프로젝트 자동화에 즉시 적용 가능하다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

claude-code anthropic automation
4분· Anthropic 공식 블로그
AI 자동 초안

Cursor 0.50, 멀티 파일 에이전트 모드 정식 출시

Cursor가 0.50 버전에서 멀티 파일 동시 편집과 터미널 자동 실행을 결합한 에이전트 모드를 정식 GA로 전환했다. 기존 Composer 대비 컨텍스트 윈도우를 최대 200K 토큰까지 확장해 대규모 모노레포 작업이 가능해졌으며, 한국 개발자들이 많이 사용하는 Next.js·NestJS 프로젝트 템플릿도 공식 지원 목록에 추가됐다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

cursor agent developer-tools
4분· Cursor 공식 블로그
2026-06-18· 3
AI 자동 초안

Google, Gemini 2.5 Flash-Lite 정식 GA—저비용 고속 추론 API 공개

Google DeepMind가 Gemini 2.5 Flash-Lite를 Google AI Studio 및 Vertex AI에서 정식 GA로 전환했다. 기존 Gemini 2.5 Flash 대비 입출력 토큰 단가를 최대 50% 낮추면서 응답 지연은 유사하게 유지해, 대량 배치 처리나 비용 민감형 프로덕션 파이프라인에 실질적인 대안이 생겼다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

google gemini api
4분· Google DeepMind Blog
AI 자동 초안

Hugging Face, 서드파티 추론 프로바이더 통합 API 정식 공개

Hugging Face가 단일 API 엔드포인트로 Together AI·Fireworks AI·Nebius 등 외부 추론 인프라를 호출할 수 있는 Inference Providers 기능을 정식 공개했다. 모델 허브에서 프로바이더를 선택하면 동일한 `InferenceClient` 코드로 공급사를 전환할 수 있어 벤더 종속 리스크가 줄어든다. 오픈소스 모델을 프로덕션에 투입하는 한국 스타트업과 크리에이터 툴 개발자에게 멀티 클라우드 전략의 실용적 출발점이 된다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

huggingface open-source inference
5분· Hugging Face Blog
AI 자동 초안

OpenAI Codex CLI 정식 GA—터미널에서 자연어로 코드 실행

OpenAI가 터미널 전용 코딩 에이전트 Codex CLI를 정식 출시했다. 로컬 파일시스템을 직접 읽고 수정하며, 샌드박스 모드와 자동 승인 모드를 분리 제공해 안전성과 생산성을 동시에 확보했다. 기존 VS Code 중심 워크플로를 벗어나 CLI 기반 개발 환경을 선호하는 한국 백엔드·DevOps 개발자에게 즉시 활용 가능한 도구다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

openai cli developer-tools
4분· OpenAI Blog
2026-06-17· 3
AI 자동 초안

OpenAI, Structured Outputs v2 정식 GA—JSON 스키마 준수율 99.9% 달성

OpenAI가 Structured Outputs v2를 정식 GA로 전환하며 복잡한 중첩 JSON 스키마에서도 99.9% 이상의 형식 준수율을 보장한다고 발표했다. 기존 v1 대비 재시도 로직 없이도 안정적인 파싱이 가능해져, 에이전트 파이프라인과 백엔드 자동화 워크플로우에서 오류 처리 코드를 대폭 줄일 수 있다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

openai structured-outputs api
4분· OpenAI Platform Changelog
AI 자동 초안

Anthropic, 프롬프트 캐시 TTL 5분→1시간으로 확장—반복 호출 비용 대폭 절감

Anthropic이 Claude API의 프롬프트 캐싱(Prompt Caching) 유효 시간을 기존 5분에서 최대 1시간으로 늘렸다. 긴 시스템 프롬프트나 대용량 컨텍스트를 반복 사용하는 에이전트·RAG 파이프라인에서 캐시 히트율이 크게 높아져 입력 토큰 비용을 최대 90%까지 줄일 수 있다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

anthropic claude cost-optimization
4분· Anthropic API Documentation
AI 자동 초안

OpenAI Realtime API WebRTC 전송 방식 정식 GA—지연 50ms 이하 달성

OpenAI가 Realtime API의 WebRTC 기반 전송 방식을 정식 GA로 전환하며, 기존 WebSocket 대비 평균 지연을 50ms 이하로 낮췄다. 음성 대화·실시간 번역·라이브 코딩 어시스턴트 등 저지연 인터랙션이 필요한 서비스에 즉시 적용 가능하다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

openai realtime webrtc
4분· OpenAI Platform Changelog
2026-06-16· 3
AI 자동 초안

GitHub Copilot Workspace, 정식 GA—이슈→PR 전 과정 자동화

GitHub이 Copilot Workspace를 모든 Copilot 구독자에게 정식 공개했다. 이슈 하나를 입력하면 계획 수립·코드 작성·테스트·PR 생성까지 단일 워크플로로 처리되며, 한국 개발자도 별도 대기 없이 즉시 활성화할 수 있다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

github copilot developer-tools
4분· GitHub Blog
AI 자동 초안

Meta, Llama 4 공식 GGUF 퀀트 배포—로컬 추론 문턱 대폭 낮춰

Meta가 Llama 4 Scout·Maverick 시리즈의 공식 GGUF 양자화 가중치를 Hugging Face Meta 공식 계정을 통해 배포했다. Q4_K_M 기준 Scout 17B 활성 파라미터 모델이 VRAM 12GB 환경에서 구동되며, 서드파티 변환 없이 llama.cpp·Ollama에서 즉시 사용할 수 있어 온프레미스·엣지 배포 수요를 정면으로 겨냥했다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

meta llama open-source
4분· Meta AI Blog / Hugging Face meta-llama
AI 자동 초안

Google DeepMind, Veo 3 영상 생성 API 정식 GA—개발자 직접 통합 가능

Google DeepMind가 텍스트·이미지 입력으로 최대 1080p 60fps 영상을 생성하는 Veo 3 모델을 Vertex AI API로 정식 공개했다. 크리에이터 툴·숏폼 플랫폼 개발자는 별도 웨이팅 리스트 없이 즉시 프로덕션 연동이 가능하며, 기존 Imagen 3 파이프라인과 동일한 인증 구조를 공유해 마이그레이션 부담이 낮다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

google video-generation api
4분· Google Cloud Blog
2026-06-15· 3
AI 자동 초안

Meta Llama 4 Maverick, OpenRouter 무료 티어 정식 개방—한국 개발자 즉시 사용 가능

OpenRouter가 Meta Llama 4 Maverick 17B-128E 모델을 무료 티어에 정식 포함해 API 키만으로 즉시 호출 가능해졌다. 컨텍스트 윈도우 1M 토큰을 무료로 활용할 수 있어 긴 문서 처리나 프로토타입 제작 비용 부담이 크게 줄어든다. 별도 클라우드 계정 없이 OpenRouter 단일 엔드포인트로 접근 가능해 한국 개발자·크리에이터의 실험적 프로젝트 진입 장벽이 낮아졌다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

llama openrouter open-source
3분· OpenRouter 공식 블로그
AI 자동 초안

EU AI법 범용 AI 의무 조항 발효—API 서비스 제공 개발자도 적용 대상

EU AI법(AI Act) GPAI 의무 조항이 오늘부터 법적 효력을 갖는다. EU 이용자를 대상으로 AI API·SaaS를 운영하는 한국 개발자·기업도 기술 문서화 및 저작권 준수 정책 공시 의무를 이행해야 하며, 위반 시 전 세계 매출의 최대 3%에 해당하는 과징금이 부과될 수 있다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

ai-policy regulation compliance
5분· EU AI Office Official
AI 자동 초안

Google, Gemma 3 27B 함수 호출 정식 지원—로컬 에이전트 구축 가능

Google DeepMind가 오픈웨이트 모델 Gemma 3 27B에 함수 호출(Function Calling) 기능을 정식 지원하기 시작했다. 이로써 개발자는 Ollama·llama.cpp 등 로컬 환경에서 외부 API 연동 에이전트를 클라우드 의존 없이 구축할 수 있게 됐다.

AI 자동 초안 · 관리자 검토 전스크립트가 자동 작성한 초안이에요. 중요한 결정 전 원문을 다시 확인해주세요.

open-source agent local-llm
4분· Google DeepMind Official Blog