Acest model nu este disponibil direct în Router by MP. Microsoft Phi-4 mini este un model open-source mic și eficient, destinat rulării pe dispozitive locale (mobil, edge). Pentru proiecte din Moldova care folosesc cloud, GPT-5 nano prin Router by Mega Promoting are calitate net superioară, factură MDL și nu necesită infrastructură proprie. Recomandare echivalentă: GPT-5 nano.Vezi GPT-5 nano

Microsoft · Phi · Chat și text

Microsoft Phi-4 mini

Modelul Microsoft mic pentru dispozitive edge — limitat pentru proiecte cloud.

~$0.08 in / $0.16 out · per 1M unități de procesare≈ 1.4 MDLvezi /pricing/models pentru tariful live →

Vezi modelul recomandat Vezi prețuri per model

128K tokens

Context window

4K tokens

Max output

Input modalities

per 1M unități de procesare

Unitate facturare

Ce este Microsoft Phi-4 mini

Microsoft Phi-4 mini este parte din strategia Microsoft pentru AI pe dispozitive locale (Surface, Copilot+ PCs, edge servers). Modelul e optimizat pentru a rula pe CPU și GPU modeste, cu performanțe surprinzător de bune pentru dimensiunea sa. Cazul de utilizare ideal: aplicații consumer care vor să ruleze AI fără conexiune internet, dispozitive industriale offline, scenarii cu cerințe stricte de confidențialitate. Pentru proiecte cloud din Moldova (majoritatea cazurilor B2B), GPT-5 nano prin Router by Mega Promoting este alegerea naturală — calitate superioară, factură MDL, zero infrastructură de gestionat. Phi-4 mini rămâne relevant doar pentru cazuri edge/offline specifice.

Capabilități unice

Ce te diferențiază când folosești Microsoft Phi-4 mini

Model mic (4B parametri) cu calitate disproporționat de bună
Open-weights MIT — auto-hostable comercial liber
Excelent raport calitate/dimensiune — top SLM (small language model) benchmark
Bun pe matematică și cod la dimensiunea lui
Rulabil pe hardware modest (GPU 16GB, chiar CPU pentru inferență single-stream)

Limitări de știut înainte să cumperi

·Nu e disponibil direct în Router by MP — folosește alternativa gpt-5.5-nano
·Calitate inferioară modelelor cloud
·Necesită infrastructură proprie sau API terț — fără factură MDL prin Router
·Limba română mai modestă
·Apelarea funcțiilor externe inconsistentă

Performanță pe benchmark-uri publice

Scoruri verificabile Microsoft Phi-4 mini

Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.

MMLU

67.3 / 100

self-reported, Phi-4-mini 3.8B

self-reported, math reasoning

sursă

Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.

Cum funcționează

Cum funcționează Microsoft Phi-4 mini pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Flux text simplificat: text intră, e descompus în unități de procesare, modelul calculează atenția pe context, apoi generează răspunsul cuvânt cu cuvânt.

Cazuri reale de utilizare

Cele mai bune scenarii pentru Microsoft Phi-4 mini

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

Chatbot · Edge deployment

Bot vocal local pe device (smartphone, kiosk)

Inferență on-device fără round-trip cloud — privacy + latență zero.

Volum tipicvaries

Cost estimat$0 (local)≈

Automatizare · On-prem SMB

Asistent auto-hostat cost-zero pentru SMB MD

Companii mici care nu vor să plătească per query — rulezi pe server existent.

Volum tipicvaries (hardware-bound)

Cost estimat$0 per query după setup≈

Date · Edge processing

Procesare date locale (IoT, embedded)

Clasificare + extragere pe device fără cloud.

Volum tipicvaries

Cost estimat$0≈

Chatbot · Privacy-first

Bot cu zero data leakage

Pentru cazuri unde nicio bucată de date nu părăsește on-prem.

Volum tipicvaries

Cost estimat$0 cloud≈

Cost lunar estimat

Calculator interactiv pentru Microsoft Phi-4 mini

Calculator interactiv

Cât te-ar costa Microsoft Phi-4 mini pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Tip caz tipic

Inferență locală pe smartphone/kiosk.

Cereri / lună100K

101.0M

Tokens intrare / cerere (prompt + context)500 tk

100 tk32K tk

Tokens ieșire / cerere (răspunsul modelului)200 tk

50 tk16K tk

Cost total estimat

$7.20

≈ 127 MDL la cursul BNM

/ lună · 100K cereri

Tokens intrare$4.00≈ 70.4 MDL

Tokens ieșire$3.20≈ 56.3 MDL

Per cerere~$0.000≈ 0.00 MDL

Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi Microsoft Phi-4 mini vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

Alternativă	Alege Microsoft Phi-4 mini când…	Mai bine alternativa când…
GPT-4o mini OpenAI Vezi	Edge deployment + zero cost per query + open-weights.	Calitate net superioară pe sarcini complexe + apelare funcții stabilă.
Mistral NeMo 12B Mistral Vezi	Mai mic (4B vs 12B) — rulabil pe hardware modest.	Calitate mai bună pe multi-language EU + context 128K.
IBM Granite 3.1 8B IBM Vezi	Mai mic + license MIT vs Apache.	Audit trail IBM + integrare watsonx enterprise.

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație	Microsoft Phi-4 mini aici	GPT-5 nano vezi pagina →	GPT-4o mini vezi pagina →	IBM Granite 3.1 8B vezi pagina →
Brand	Microsoft	OpenAI	OpenAI	IBM
Preț input / 1M tokens	$0.080≈ 1.4 MDL	$0.480≈ 8.5 MDL	$0.240≈ 4.2 MDL	$0.200≈ 3.5 MDL
Preț output / 1M tokens	$0.160≈ 2.8 MDL	$2.40≈ 42.3 MDL	$0.960≈ 16.9 MDL	$0.600≈ 10.6 MDL
Context max	128K tk	64K tk	128K tk	128K tk
Output max	4K tk	8K tk	16K tk	4K tk
Vision	—	—	●	—
Audio (input)	—	—	—	—
Knowledge cut-off	—	2026-01	2024-10	—

Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi Microsoft Phi-4 mini în cele mai populare unelte.

Pont Microsoft Phi-4 mini: Phi-4 mini rulează decent pe GPU 16GB (RTX 4080) sau M3 Max 36GB. Pentru pipeline-uri MD pe edge (terminale POS retail, kiosk mall), e alegerea evidentă — zero costuri recurente, privacy maximă, latență sub 100ms local.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK

Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.

app/api/chat/route.ts

import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("phi-4-mini"),
    messages,
  });
  return result.toDataStreamResponse();
}

Docs oficiale

OpenAI SDK (Node.js)

Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.

client.ts

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "phi-4-mini",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);

Docs oficiale

OpenAI SDK (Python)

Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.

client.py

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="phi-4-mini",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)

Docs oficiale

LangChain (Python)

RAG, agenți, chain-uri complexe — toate prin Router.

rag.py

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="phi-4-mini",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)

Docs oficiale

LangChain (JS)

Versiunea JavaScript — același API ca Python.

agent.ts

import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "phi-4-mini",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);

Docs oficiale

LlamaIndex

RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.

rag_index.py

from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="phi-4-mini",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))

Docs oficiale

FastAPI proxy

Endpoint back-end care expune Router în propria ta aplicație.

main.py

from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="phi-4-mini",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}

Docs oficiale

Next.js Server Action

Apel direct din componente React, fără API route separat.

app/actions.ts

"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "phi-4-mini",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}

Docs oficiale

Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru Microsoft Phi-4 mini

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

phi-4-mini.ts

typescript

1import OpenAI from "openai";
2 
3// Pentru proiecte cloud uzuale, folosește GPT-5 nano prin Router
4const client = new OpenAI({
5  apiKey: process.env.ROUTER_API_KEY,
6  baseURL: "https://api.megapromoting.com/v1",
7});
8 
9const r = await client.chat.completions.create({
10  model: "gpt-5.5-nano",
11  messages: [
12    { role: "user", content: "Clasifică acest mesaj client în: vânzări / suport / spam. Mesaj: 'Bună ziua, când îmi sosește comanda?'" },
13  ],
14});
15 
16console.log(r.choices[0].message.content);

Pont-uri pentru implementare în Moldova

1Pentru proiecte B2B uzuale Moldova cu acces internet, gpt-5.5-nano prin Router e net mai puternic și are factură MDL.
2Pentru aplicații Android/iOS cu AI on-device offline, Phi-4 mini e relevant ca instrument extern.
3Pentru sectoare reglementate care nu pot trimite date la cloud, evaluează rulare locală Phi pe servere proprii.

Întrebări frecvente

FAQ Microsoft Phi-4 mini

Voi integra Phi în Router?

Nu este planificat. Pentru clienți enterprise cu cerințe stricte de privacy, scrie-ne pentru ofertă cu deployment local Phi.

Cât de bună e calitatea pe română?

Acceptabilă pentru clasificare simplă. Pentru chat conversațional, gpt-5.5-nano prin Router e net superior.

Pot rula Phi-4 mini local?

Da, modelul e open-source pe Hugging Face. Funcționează pe laptop cu 8GB RAM. Cerințe: ollama sau LM Studio pentru ușurință.

Continuă explorarea

Modele înrudite

OpenAI

GPT-5 nano

Modelul OpenAI ultra-economic pentru clasificare, scoring și sarcini cu trafic foarte mare.

Vezi detalii

OpenAI

GPT-4o mini

Versiunea mini veche — încă populară pentru chatboți cu buget strâns.

Vezi detalii

IBM

IBM Granite 3.1 8B

Modelul IBM open-source pentru enterprise cu garanții corporate.

Vezi detalii

Mistral

Mistral NeMo 12B

Modelul Mistral × NVIDIA open-source — accesibil ca rulare proprie.

Vezi detalii

Vrei să fii notificat când e gata pentru Microsoft Phi-4 mini?

Te anunțăm pe email când modelul devine rutabil prin Router. Între timp, începe cu o alternativă recomandată.

Înscrie-te la notificare Vezi modelele disponibile

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant