Classify

from retab import Retab

client = Retab()

# Classify a document into one of the provided categories
# Use first_n_pages to only analyze the first 3 pages (useful for large documents)
result = client.documents.classify(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,  # Optional: only use first 3 pages for classification
    context="Processing batch from Q4 2024 vendor submissions"  # Optional: additional context
)

# Access classification result
print(f"Classification: {result.result.classification}")
print(f"Reasoning: {result.result.reasoning}")

# Example output:
# Classification: invoice
# Reasoning: The document contains billing details including line items, 
# unit prices, quantities, and a total amount due. It has a header with 
# "INVOICE" and includes payment terms and a due date.

{
  "result": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due. It has a header with 'INVOICE' prominently displayed and includes standard invoice elements such as invoice number, date, payment terms, and a due date. The format and content are consistent with typical invoice documents.",
    "classification": "invoice"
  }
}

POST

documents

classify

from retab import Retab

client = Retab()

# Classify a document into one of the provided categories
# Use first_n_pages to only analyze the first 3 pages (useful for large documents)
result = client.documents.classify(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,  # Optional: only use first 3 pages for classification
    context="Processing batch from Q4 2024 vendor submissions"  # Optional: additional context
)

# Access classification result
print(f"Classification: {result.result.classification}")
print(f"Reasoning: {result.result.reasoning}")

# Example output:
# Classification: invoice
# Reasoning: The document contains billing details including line items, 
# unit prices, quantities, and a total amount due. It has a header with 
# "INVOICE" and includes payment terms and a due date.

{
  "result": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due. It has a header with 'INVOICE' prominently displayed and includes standard invoice elements such as invoice number, date, payment terms, and a due date. The format and content are consistent with typical invoice documents.",
    "classification": "invoice"
  }
}

from retab import Retab

client = Retab()

# Classify a document into one of the provided categories
# Use first_n_pages to only analyze the first 3 pages (useful for large documents)
result = client.documents.classify(
    document="invoice.pdf",
    model="retab-small",
    categories=[
        {"name": "invoice", "description": "Invoice documents with billing information"},
        {"name": "receipt", "description": "Receipt documents for payments"},
        {"name": "contract", "description": "Legal contract documents"},
    ],
    first_n_pages=3,  # Optional: only use first 3 pages for classification
    context="Processing batch from Q4 2024 vendor submissions"  # Optional: additional context
)

# Access classification result
print(f"Classification: {result.result.classification}")
print(f"Reasoning: {result.result.reasoning}")

# Example output:
# Classification: invoice
# Reasoning: The document contains billing details including line items, 
# unit prices, quantities, and a total amount due. It has a header with 
# "INVOICE" and includes payment terms and a due date.

{
  "result": {
    "reasoning": "The document contains billing details including line items, unit prices, quantities, and a total amount due. It has a header with 'INVOICE' prominently displayed and includes standard invoice elements such as invoice number, date, payment terms, and a due date. The format and content are consistent with typical invoice documents.",
    "classification": "invoice"
  }
}

Authorizations

Api-Key

string

header

required

Query Parameters

access_token

string | null

Body

application/json

document

MIMEData · object

required

The document to classify

Show child attributes

Response

Successful Response

result

ClassifyResult · object

required

The classification result with reasoning

Show child attributes

Split Fill Document

API Reference

Schemas

Documents

Edit

Workflows

Jobs

Projects

Extractions

Authorizations

Query Parameters

Body

Response