Create Classification

from retab import Retab

client = Retab()

classification = client.classifications.create(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,
    instructions="Processing batch from Q4 2024 vendor submissions",
    n_consensus=1,
)

print(f"Classification ID: {classification.id}")
print(f"Category: {classification.output.category}")
print(f"Reasoning: {classification.output.reasoning}")

{
  "id": "cls_01G34H8J2K",
  "file": {
    "id": "file_6dd6eb00688ad8d1",
    "filename": "invoice.pdf",
    "mime_type": "application/pdf"
  },
  "model": "retab-small",
  "categories": [
    {
      "name": "invoice",
      "description": "Invoice documents with billing information"
    },
    { "name": "receipt", "description": "Receipt documents for payments" },
    { "name": "contract", "description": "Legal contract documents" }
  ],
  "n_consensus": 1,
  "instructions": "Processing batch from Q4 2024 vendor submissions",
  "output": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due.",
    "category": "invoice"
  },
  "consensus": {
    "choices": [],
    "likelihood": null
  },
  "usage": {
    "prompt_tokens": 1500,
    "completion_tokens": 40,
    "total_tokens": 1540
  },
  "created_at": "2024-03-15T10:30:00Z"
}

POST

classifications

from retab import Retab

client = Retab()

classification = client.classifications.create(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,
    instructions="Processing batch from Q4 2024 vendor submissions",
    n_consensus=1,
)

print(f"Classification ID: {classification.id}")
print(f"Category: {classification.output.category}")
print(f"Reasoning: {classification.output.reasoning}")

{
  "id": "cls_01G34H8J2K",
  "file": {
    "id": "file_6dd6eb00688ad8d1",
    "filename": "invoice.pdf",
    "mime_type": "application/pdf"
  },
  "model": "retab-small",
  "categories": [
    {
      "name": "invoice",
      "description": "Invoice documents with billing information"
    },
    { "name": "receipt", "description": "Receipt documents for payments" },
    { "name": "contract", "description": "Legal contract documents" }
  ],
  "n_consensus": 1,
  "instructions": "Processing batch from Q4 2024 vendor submissions",
  "output": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due.",
    "category": "invoice"
  },
  "consensus": {
    "choices": [],
    "likelihood": null
  },
  "usage": {
    "prompt_tokens": 1500,
    "completion_tokens": 40,
    "total_tokens": 1540
  },
  "created_at": "2024-03-15T10:30:00Z"
}

Classify a document into one of the provided categories and persist the result as a Classification resource that can later be retrieved via GET /v1/classifications/{classification_id} or listed via GET /v1/classifications.

from retab import Retab

client = Retab()

classification = client.classifications.create(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,
    instructions="Processing batch from Q4 2024 vendor submissions",
    n_consensus=1,
)

print(f"Classification ID: {classification.id}")
print(f"Category: {classification.output.category}")
print(f"Reasoning: {classification.output.reasoning}")

{
  "id": "cls_01G34H8J2K",
  "file": {
    "id": "file_6dd6eb00688ad8d1",
    "filename": "invoice.pdf",
    "mime_type": "application/pdf"
  },
  "model": "retab-small",
  "categories": [
    {
      "name": "invoice",
      "description": "Invoice documents with billing information"
    },
    { "name": "receipt", "description": "Receipt documents for payments" },
    { "name": "contract", "description": "Legal contract documents" }
  ],
  "n_consensus": 1,
  "instructions": "Processing batch from Q4 2024 vendor submissions",
  "output": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due.",
    "category": "invoice"
  },
  "consensus": {
    "choices": [],
    "likelihood": null
  },
  "usage": {
    "prompt_tokens": 1500,
    "completion_tokens": 40,
    "total_tokens": 1540
  },
  "created_at": "2024-03-15T10:30:00Z"
}

Authorizations

Api-Key

string

header

required

Body

application/json

Public create-classification request body.

document

MIMEData · object

required

A file represented by its filename and a base64 data url.

MIMEData
FileRef

Show child attributes

Response

Successful Response

A classification result: the categories a document was scored against and the chosen output decision.

string

required

Unique identifier of the classification

file

FileRef · object

required

Information about the classified file

Show child attributes

model

string

required

Model used for classification

Documentation Index

Authorizations

Body

Response