Wyszukiwanie rysunków CAD AI: Jak firmy budowlane znajdują warstwy DWG w sekundy

2026-04-09 | Rafał Maison

„Znajdź wszystkie rysunki wentylacji dla Budynku C, trzecie piętro, zaprojektowane między marcem a czerwcem 2024.”

 

Dla kierownika projektu budowlanego z 10 000+ plików AutoCAD w 20 aktywnych projektach, takie zapytanie tradycyjnie wymagało ręcznej nawigacji po folderach, otwierania dziesiątek plików DWG jeden po drugim i sprawdzania nazw warstw.

 

Zmierzona wartość bazowa (time-motion study): mediana czasu wyszukiwania 87 minut.

 

Po ekstrakcji metadanych AI: 3 minuty end-to-end (zapytanie → plik otwarty w AutoCAD). W przypadku zapytań, gdzie użytkownik musi tylko zidentyfikować które pliki są istotne (bez jeszcze otwierania), czas odpowiedzi spada do poniżej sekundy.

 

Kiedy Tomasz, starszy inżynier który „wszystko pamiętał”, przeszedł na emeryturę w zeszłym roku, firma straciła 15 lat wiedzy projektowej — bo istniała tylko w jego głowie, a nie w przeszukiwalnych metadanych.

 

Krótko mówiąc: Czy AI potrafi znaleźć konkretne warstwy rysunków CAD bez ręcznego otwierania plików w AutoCAD w 2026 roku?
Tak — poprzez specjalistyczną ekstrakcję metadanych CAD, nie ogólne wyszukiwanie dokumentów. Firma budowlana z 4600 plikami DWG zredukowała czas wyszukiwania z mediany 87 minut do ~3 minut end-to-end dla typowych zapytań o warstwy (redukcja 96%). Dla wszystkich typów zapytań — włączając złożoną koordynację międzybranżową i porównania rewizji — zespół zmierzył średnią redukcję czasu o 86%, oszczędzając ~156 000 PLN rocznie na kierownika projektu (w oparciu o odzyskany czas wyszukiwania przy stawce 200 PLN/h fully-loaded).

 

Poniżej techniczna analiza wyzwań związanych z wyszukiwaniem CAD, metod ekstrakcji metadanych i rzeczywistej ekonomii wdrożenia w środowiskach budowlanych.

 


 

Ukryty koszt „zaledwie pięciu minut”

 

Badania time-motion study 10 inżynierów przez 2 tygodnie ujawniły rzeczywiste zachowania wyszukiwania:

 

Mediana czasu wyszukiwania: 87 minut (nie „5 minut” jak użytkownicy sami deklarowali)

 

Rozkład:
– Błędna nawigacja po folderach: 12 min
– Otwieranie kandydujących plików: 28 min
– Sprawdzanie widoczności warstw: 18 min
– Pytanie kolegów: 15 min
– Znalezienie właściwej rewizji: 14 min

 

Dla 50 inżynierów przy 1,5 wyszukiwania/dzień:
– 50 × 1,5 × 87 min × 200 dni = 21 750 godzin rocznie
– Przy 200 PLN/godz = 4 350 000 PLN/rok straconego czasu na wyszukiwanie

 


 

Problem wyszukiwania CAD: Dlaczego ogólne narzędzia zawodzą

 

Co czyni rysunki CAD innymi od dokumentów

 

Tradycyjne wyszukiwanie dokumentów (PDF, Word) indeksuje treść tekstową. Rysunki CAD przechowują informacje w:

 

Co czyni rysunki CAD innymi od dokumentów

 

Nic z tego nie jest przeszukiwalne standardowym AI tekstowym.

 


 

Rzeczywista złożoność: Projekty wielowarstwowe

 

Typowy projekt budowy komercyjnej zawiera:

 

– 200-500 rysunków architektonicznych
– 150-300 rysunków konstrukcyjnych
– 200-400 rysunków MEP (mechanika, elektryka, hydraulika)
– 50-100 rysunków infrastruktury/terenu

 

Łącznie: 600-1300 plików DWG na projekt

 

Każdy rysunek zawiera:
– 20-50 warstw
– 100-500 bloków
– 10-30 xrefów

 

Łącznie przeszukiwalne elements: ~50 000 punktów metadanych

 


 

Przykład: Znajdowanie danych wentylacyjnych

 

Zapytanie: „Pokaż wszystkie kanały nawiewne HVAC na poziomie 3″

 

Co wie inżynier:
– Branża: Mechanika
– System: HVAC
– Komponent: Kanały nawiewne (nie wywiewne, nie wyciągowe)
– Lokalizacja: Poziom 3

 

Jak to wygląda w plikach CAD:

 

Plik: `M-3-HVAC-001-R3.dwg`
– Warstwa: `M-HVAC-SUPP` (kanały nawiewne)
– Warstwa: `M-HVAC-RETN` (kanały wywiewne — nieistotne)
– Blok: `DUCT-RECT-12×8` (kanał prostokątny 12″×8″)
– Xref: `A-3-FLOOR-001-R2.dwg` (rzut architektoniczny dla kontekstu)

 

Zachowanie SharePoint/wyszukiwania ogólnego:
– Wyszukuje tylko nazwę pliku: `M-3-HVAC-001-R3.dwg`
– Zwraca: „Plik znaleziony” (ale które warstwy? które komponenty?)
– Inżynier musi pobrać, otworzyć w AutoCAD, sprawdzić warstwy ręcznie
Czas: 5-10 minut na plik × 20 kandydujących plików = 2 godziny

 

Zachowanie wyszukiwania CAD AI:
– Parsuje metadane DWG programowo bez ręcznego otwierania plików w AutoCAD
– Identyfikuje warstwy: `M-HVAC-SUPP` ✅ | `M-HVAC-RETN` ❌
– Filtruje po poziomie: `3` ✅
– Zwraca: Konkretne warstwy w konkretnych plikach
Czas: 8 sekund

 


 

Architektura techniczna: Jak działa ekstrakcja metadanych CAD

 

Krok 1: Parsowanie plików DWG

 

Pliki CAD są binarne (nie tekstowe). Standardowe OCR/NLP całkowicie zawodzi. Używamy dwustopniowego podejścia:

 

Etap 1: Konwersja binarna (DWG → DXF)

 

DWG to zastrzeżony format binarny. Przed parsowaniem konwertujemy do DXF (Drawing Exchange Format) lub wyodrębniamy przez API:

 

Narzędzia konwersji:
Autodesk Forge API: Ekstrakcja w chmurze (SaaS, płatność za plik)
ODA File Converter: Wsadowa konwersja desktopowa; automatyzacja zależy od środowiska
Open Design Alliance SDK: Programowy dostęp klasy enterprise (licencjonowany)

 

# Przykład: Wsadowa konwersja DWG → DXF przy użyciu ODA
./ODAFileConverter input_folder output_folder ACAD2018 DXF 0 1

 


 

Etap 2: Ekstrakcja metadanych (parsowanie DXF/JSON)

 

Po konwersji do DXF lub JSON (przez Forge), używamy ezdxf do ekstrakcji danych strukturalnych:

 

import ezdxf

# Wczytaj plik DXF (przekonwertowany z DWG)
doc = ezdxf.readfile(’M-3-HVAC-001-R3.dxf’)

# Wyodrębnij warstwy
layers = [layer.dxf.name for layer in doc.layers]
# Wynik: [’M-HVAC-SUPP’, 'M-HVAC-RETN’, 'M-HVAC-EXHS’, …]

# Wyodrębnij bloki
blocks = [block.name for block in doc.blocks]
# Wynik: [’DUCT-RECT-12×8′, 'DIFFUSER-4WAY’, …]

# Wyodrębnij metadane nagłówka
revision_date = doc.header[’$TDUPDATE’] # Timestamp ostatniej aktualizacji
dwg_version = doc.header[’$ACADVER’] # Wersja AutoCAD

 

Ważna uwaga o metadanych projektu:
Numery projektów, tytuły i kody rewizji są zazwyczaj przechowywane w atrybutach tablicy tytułowej lub właściwościach niestandardowych, nie w standardowych nagłówkach DWG. Wyodrębniamy je przez:
– Encje `ATTRIB` (dane tablicy tytułowej)
– Właściwości niestandardowe `XRECORD`
– OCR na grafikach tablicy tytułowej (dla starszych rysunków)

 

Wyzwanie: Format DWG ewoluował znacząco (AutoCAD R14 → 2025). Warstwa konwersji musi obsługiwać różnice wersji; ezdxf następnie pracuje ze znormalizowanym wyjściem DXF.

 


 

Krok 2: Klasyfikacja branży

 

Konwencje nazewnictwa warstw są bardzo zróżnicowane:

 

Wytyczne AIA CAD Layer (popularne w projektach US/międzynarodowych):
– Prefix: Branża (A=Architektura, M=Mechanika, E=Elektryka, S=Konstrukcja)
– Grupa główna: System (HVAC, PLBG, WALL, DOOR)
– Grupa poboczna: Komponent (SUPP, RETN, FULL, JAMB)

 

Przykładowe warstwy:
– `A-WALL-FULL` → Architektura, Ściany, Pełnej wysokości
– `M-HVAC-SUPP` → Mechanika, HVAC, Nawiew
– `E-LITE-CEIL` → Elektryka, Oświetlenie, Sufitowe
– `S-COLS-CONC` → Konstrukcja, Słupy, Betonowe

 

Ważne: Traktujemy nazewnictwo AIA/NCS jako pomocne wzorce dla rozpoznawania, nie wymóg. Wiele polskich firm używa własnych konwencji (warianty ISO 13567, kody firmowe). Nasz klasyfikator uczy się WASZYCH konwencji nazewnictwa podczas treningu.

 

Rzeczywiste nazwy warstw, które spotkaliśmy:
– `WENTYLACJA` (po polsku wentylacja — niestandardowe)
– `INST.SANIT.` (skrót, kropki zamiast myślników)
– `MECH-1` (niejasne, brak określenia systemu)
– `Layer1` (całkowicie niedescriptywne)
– `HVAC_Supply_Ductwork_Level_3` (nadmiernie rozwlekłe)

 

Rozwiązanie: Niestandardowy model klasyfikacji wytrenowany na 10 000+ rzeczywistych warstwach projektowych z istniejących rysunków klienta.

 

# Klasyfikacja warstwy przez dopasowanie wzorców + ML
def classify_layer(layer_name):
if re.match(r’M-HVAC-SUPP’, layer_name):
return {’discipline’: 'Mechanical’, 'system’: 'HVAC’, 'component’: 'Supply’}
elif 'WENTYLACJA’ in layer_name.upper():
return {’discipline’: 'Mechanical’, 'system’: 'Ventilation’, 'component’: 'General’}
else:
return ml_model.predict(layer_name) # Fallback do wytrenowanego klasyfikatora

 

Strategia minimalizacji błędów:

 

Nasz system rozdziela trzy poziomy ryzyka:

 

1. Ekstrakcja metadanych (deterministyczna, obserwowalne awarie):
Nazwy warstw, nazwy bloków, ścieżki xref są odczytywane bezpośrednio ze struktury DXF. Brak ML — to czyste parsowanie danych.

 

Tryby awarii:
– Uszkodzenie pliku: ~2-3% starszych plików zawodzi przy konwersji (ODA zwraca kod błędu)
– Problemy z kodowaniem: Znaki non-ASCII w nazwach warstw czasem zniekształcone (Europa Wschodnia, znaki azjatyckie)
– Rozwiązywanie ścieżek xref: Mapowane dyski sieciowe (np. `Z:\Projekty\`) nie tłumaczą się na ścieżki chmurowe bez ręcznego mapowania
– Niekompatybilność wersji DWG: Pliki sprzed R14 (rzadkie) wymagają wsadowego upgrade przez TrueView

 

Obsługa: Nieudane konwersje są logowane z szczegółami błędu. Indeks wyszukiwania pokazuje plik jako „konwersja nieudana – wymagana ręczna weryfikacja” zamiast cichego pomijania. IT klienta może ponowić próbę z innymi ustawieniami konwersji lub oznaczyć jako „archiwum legacy” (wykluczone z wyszukiwania).

 

Zmierzony wskaźnik sukcesu (ten projekt): 4508 z 4600 plików pomyślnie przekonwertowanych (98%). Pozostałe 92 pliki zakolejkowane do ręcznej weryfikacji (głównie uszkodzone pliki z ery 2005-2008).

 

2. Klasyfikacja (oparta na ML, ~5-8% wskaźnik błędów):
Przypisywanie branży/systemu do niestandardowych nazw warstw używa wytrenowanego klasyfikatora. Gdy pewność <80%, warstwa jest oznaczana jako „nieklasyfikowana” zamiast zgadywania.

 

Przykład: Warstwa „INST_SANIT_1″ → pewność klasyfikatora 72% → oznaczona jako „branża: nieznana, wymaga ręcznej weryfikacji”

 

3. Wyszukiwanie semantyczne (embeddingi LLM, ryzyko halucynacji):
Krytyczne zabezpieczenie: Wyniki wyszukiwania ZAWSZE linkują do konkretnego pliku + warstwy + referencji bloku/xref (uchwyt obiektu / ID encji, w zależności od formatu ekstrakcji). System nigdy nie generuje podsumowań tekstowych ani nie „interpretuje” treści — tylko odzyskuje i wskazuje źródło.

 

Przykład czego NIE robimy:
Użytkownik pyta: „Jaki jest rozmiar kanału nawiewnego na poziomie 3?”
❌ Źle (ryzyko halucynacji): AI odpowiada „12 cali × 8 cali”
✅ Dobrze (oparte na cytowaniu): AI odpowiada „Znaleziono w `M-3-HVAC-007-R4.dwg`, warstwa `M-HVAC-SUPP`, blok `DUCT-RECT-12×8`” (użytkownik weryfikuje w AutoCAD)

 

Ten design zapewnia, że nawet jeśli klasyfikacja się myli, użytkownik może zwalidować względem pliku źródłowego — utrzymując zaufanie do systemu.

 


 

Krok 3: Indeksowanie semantyczne

 

Wyodrębnione metadane → embeddingi wektorowe dla wyszukiwania semantycznego.

 

Przykład rekordu metadanych:

{
„file_path”: „Projects/BuildingC/Mechanical/M-3-HVAC-001-R3.dwg”,
„file_name”: „M-3-HVAC-001-R3.dwg”,
„discipline”: „Mechanical”,
„level”: „3”,
„revision”: „R3”,
„revision_date”: „2024-06-15”,
„layers”: [
{
„name”: „M-HVAC-SUPP”,
„system”: „HVAC”,
„component”: „Kanały nawiewne”,
„entity_count”: 342
},
{
„name”: „M-HVAC-RETN”,
„system”: „HVAC”,
„component”: „Kanały wywiewne”,
„entity_count”: 198
}
],
„blocks”: [„DUCT-RECT-12×8”, „DUCT-ROUND-10”, „DIFFUSER-4WAY”],
„xrefs”: [„A-3-FLOOR-001-R2.dwg”]
}

 

Ten JSON → osadzony jako wektor → przechowywany w Qdrant dla wyszukiwania semantycznego.

 


 

Krok 4: Przetwarzanie zapytań w języku naturalnym

 

Zapytanie użytkownika: „Znajdź wszystkie rysunki wentylacji dla Budynku C, trzecie piętro, marzec-czerwiec 2024″

 

Parsowanie zapytania:

query = „Znajdź wszystkie rysunki wentylacji dla Budynku C, trzecie piętro, marzec-czerwiec 2024”

# Wyodrębnienie intencji
discipline = „Mechanical” # wentylacja → HVAC → Mechanika
system = „Ventilation”
location = {„building”: „C”, „level”: „3”}
date_range = {„start”: „2024-03-01”, „end”: „2024-06-30”}

# Budowa filtra
filters = {
„discipline”: „Mechanical”,
„system”: {„$in”: [„HVAC”, „Ventilation”]},
„level”: „3”,
„file_path”: {„$contains”: „BuildingC”},
„revision_date”: {„$gte”: „2024-03-01”, „$lte”: „2024-06-30”}
}

# Wyszukiwanie wektorowe + filtr
results = vector_db.search(query_embedding, filters=filters, limit=20)

 

Czas zapytania backendu: 0,3 sekundy (tylko wyszukiwanie w indeksie)

 

Rozkład czasu end-to-end:
– Zapytanie indeksu: 0,3s
– Odzyskiwanie metadanych pliku: 0,1s
– Ranking/sortowanie wyników: 0,1s
Łączna odpowiedź serwera: 0,5 sekundy

 

Czas postrzegany przez użytkownika (8-12 sekund) zawiera:
– Opóźnienie sieciowe (użytkownik → serwer): 0,2s
– Pobieranie pliku z ACC (jeśli otwieranie): 2-3s
– Uruchamianie AutoCAD/przeglądarki: 5-8s

 

Gdy użytkownik potrzebuje tylko zobaczyć które pliki są istotne (nie otwierać ich), odpowiedź jest poniżej sekundy.

 


 

Case study: 4600 plików rysunkowych, 70% oszczędności czasu

 

Profil klienta:
– Średniej wielkości firma budowlana
– 15 aktywnych projektów (mieszkaniowe, komercyjne, przemysłowe)
– 4600 plików CAD (AutoCAD 2018-2024)
– 50 inżynierów i kierowników projektów

 

Problem:

 

Przed AI:

 

Scenariusz 1: Kontrola zgodności
> „Znajdź wszystkie przegrody ognioodporne w Budynku A, poziomy 1-3″

 

Proces inżyniera:
1. Otwarcie folderu projektu dla Budynku A
2. Nawigacja do Architektura → Detale
3. Ręczne otwieranie 40+ rysunków szczegółowych
4. Sprawdzenie każdego pod kątem adnotacji ognioodporności
5. Krzyżowe odniesienia z kartami specyfikacji
6. Kompilacja listy w Excel

 

Czas: 3 godziny

 


 

Scenariusz 2: Koordynacja projektowa
> „Pokaż rozdzielnie elektryczne na piętrach gdzie są pomieszczenia techniczne HVAC”

 

Wymaga:
– Znalezienia lokalizacji pomieszczeń technicznych HVAC (rysunki mechaniczne)
– Krzyżowego odniesienia ze schedułami rozdzielni elektrycznych (rysunki elektryczne)
– Sprawdzenia konfliktów

 

Czas: 4 godziny (lub po prostu zapytaj starszego inżyniera który „wie gdzie wszystko jest”)

 


 

Scenariusz 3: Śledzenie rewizji
> „Co się zmieniło w rysunkach konstrukcyjnych między Rewizją 2 a Rewizją 4?”

 

Obecna metoda:
– Otwarcie obu wersji w AutoCAD
– Użycie komendy `COMPARE` (wolne, często się zawiesza)
– Ręczne dokumentowanie różnic

 

Czas: 2 godziny na zestaw rysunków

 


 

Skumulowany wpływ:

 

Początkowe przybliżone szacowanie (wstępne):
– 50 inżynierów × 90 minut/dzień wyszukiwania × 200 dni/rok = 15 000 godzin rocznie

 

Po time-motion study (zmierzony baseline, marzec 2024):
– 50 inżynierów × 1,5 wyszukiwania/dzień × 87 min na wyszukiwanie × 200 dni = 21 750 godzin rocznie
– Przy 200 PLN/godz fully-loaded = 4 350 000 PLN/rok kosztów wyszukiwania

 

Zmierzony baseline był 45% wyższy niż początkowe szacowanie — inżynierowie niedoszacowywali częstotliwości wyszukiwania gdy pytani przypadkowo.

 


 

Rozwiązanie: Wdrożenie DocuFind AI z modułem inteligencji CAD

 

Implementacja (4 tygodnie):

 

Tydzień 1-2: Ekstrakcja metadanych
– Wdrożenie pipeline konwersji DWG→DXF na instancjach AWS EC2 compute (c5.4xlarge, 16 vCPU)
– Przetworzenie 4600 plików DWG → wyodrębnienie 187 000 rekordów warstw
– OCR dla tablic tytułowych (numery projektów, daty, rewizje) przy użyciu Tesseract

 

Uwaga o infrastrukturze: Akceleracja GPU była używana tylko dla opcjonalnego semantycznego rerankingu (embeddingi LLM). Podstawowa konwersja DWG→DXF (ODA/Forge) i parsowanie metadanych (ezdxf) działają na CPU. Dla tej skali projektu instancja 16-rdzeniowa obsługiwała konwersję z prędkością ~8 plików/minutę.

 

Tydzień 3: Funkcje niestandardowe
– Wytrenowanie klasyfikatora branży na niestandardowych nazwach warstw klienta
– Zbudowanie słownika synonimów:
– „WENTYLACJA” → „HVAC” → „Wentylacja mechaniczna”
– „INST. SANIT.” → „Instalacje sanitarne”
– „KNA” → „Karta Nadzoru Autorskiego”

 

Tydzień 4: Integracja + szkolenie
– Integracja API z Autodesk Construction Cloud
– Interfejs webowy dla zapytań w języku naturalnym
– Szkolenie zespołu (2 godziny, hands-on z rzeczywistymi zapytaniami)

 


 

Wyniki po 6 miesiącach:

 

Scenariusz 1: Kontrola zgodności (ściany ognioodporne)

 

Zapytanie: „ściany ognioodporne Budynek A poziomy 1-3″

 

Odpowiedź AI (8 sekund):
– 15 rysunków szczegółowych zawierających przegrody ognioodporne
– Warstwy: `A-WALL-FIRE`, `A-DETL-WALL`
– Pliki automatycznie otwarte w widoku porównawczym rysunków

Wyszukiwanie rysunków CAD AI: Jak firmy budowlane znajdują warstwy DWG w sekundy

 

Ważne wyjaśnienie: „8 sekund” zawiera wyszukiwanie metadanych (0,3s) + pobieranie pliku z ACC (2-3s) + uruchamianie AutoCAD (4-5s). Same pliki DWG są nadal otwierane w AutoCAD do przeglądania, ale samo wyszukiwanie nie wymaga ręcznego otwierania plików — system identyfikuje które pliki/warstwy są istotne zanim użytkownik dotknie AutoCAD.

 


 

Scenariusz 2: Koordynacja projektowa (elektryka + HVAC)

 

Zapytanie: „rozdzielnie elektryczne na piętrach z pomieszczeniami technicznymi HVAC”

 

Odpowiedź AI (12 sekund):
– Krzyżowe odniesienie rysunków mechanicznych (lokalizacje pomieszczeń technicznych według piętra/siatki)
– Dopasowanie z rysunkami elektrycznymi (lokalizacje rozdzielni według piętra/siatki)
– Oznaczone do weryfikacji: rozdzielnia i nawiew HVAC na tym samym piętrze/siatce (wymagana ręczna weryfikacja)

 

CAD AI Czas: 12 sekund (z 4 godzin) → redukcja 95%

Ważna uwaga: To identyfikuje kandydujące konflikty do weryfikacji przez inżyniera w oparciu o bliskość piętra/siatki, nie prawdziwą geometryczną detekcję kolizji. Rzeczywista detekcja kolizji 3D wymaga analizy geometrii (przez Navisworks/Revit) lub ingesti raportów kolizji BIM — które możemy zintegrować jeśli Wasz workflow BIM zawiera wyjście detekcji kolizji.

 


 

Scenariusz 3: Śledzenie rewizji

 

Zapytanie: „zmiany w rysunkach konstrukcyjnych od R2 do R4″

 

Odpowiedź AI (15 sekund):
– Porównanie metadanych między rewizjami
– Zidentyfikowane: 3 nowe warstwy, 12 usuniętych bloków, 47 zmodyfikowanych encji
– Wygenerowany wizualny raport różnic (PDF)

CAD AI Czas: 15 sekund (z 2 godzin) → redukcja 93%


 

Wpływ finansowy:

 

Metodologia pomiarowa:

 

Przed obliczeniem ROI, ustaliliśmy baseline poprzez time-motion study (2 tygodnie, marzec 2024):
– Obserwacja 10 inżynierów w 3 projektach
– Zalogowano 147 operacji wyszukiwania
– Mediana czasu wyszukiwania: 87 minut (od zapytania do znalezienia właściwego rysunku/warstwy)
– Przykładowe zapytania: „ściany ognioodporne Budynek A”, „routing kanałów HVAC Poziom 3 Siatka B”, „zmiany słupów konstrukcyjnych R2 do R4″

 

Założenia:
– 50 inżynierów wykonujących wyszukiwania CAD
– Średnio 1,5 wyszukiwania dziennie na inżyniera (konserwatywne; power userzy robią 3-5)
– Baseline czasu wyszukiwania: 87 minut na wyszukiwanie (mediana z time-motion study)
– Czas wyszukiwania po AI: 3 minuty dla typowych zapytań o warstwy (P50), 12 minut dla złożonych zapytań międzybranżowych (P90)
– Koszt inżyniera fully-loaded: 200 PLN/godzinę (wynagrodzenie + świadczenia + overhead)
– Dni robocze: 200/rok (bez weekendów, świąt, zwolnień chorobowych)

 

Kalkulacja oszczędności czasu:
– Dzienny czas wyszukiwania przed: 1,5 wyszukiwania × 87 min = 130,5 min/inżynier
– Dzienny czas wyszukiwania po: 1,5 wyszukiwania × 11 min = 16,5 min/inżynier (średnia ważona dla typów zapytań)
– Zaoszczędzony czas na inżyniera: 114 min/dzień = 1,9 godziny/dzień
– Zaoszczędzony czas zespołu: 50 × 1,9h × 200 dni = 19 000 godzin/rok
– Wartość przy 200 PLN/godzinę: 3 800 000 PLN/rok

 

Uwaga: To używa średniej ważonej czasu po AI (60% × 3min + 30% × 12min + 10% × 15min = 11min). Konserwatywne szacowanie wyklucza pośrednie oszczędności (zmniejszona duplikacja pracy, szybsza odpowiedź na RFI, zapobieganie błędom), które dodałyby szacowane 20-30%.

 


 

Rzeczywiste zmierzone wyniki (nie prognozowane):

 

Metryki po wdrożeniu (średnia 6-miesięczna, wrzesień 2024 – luty 2025):
– Zapytań dziennie: 73 (monitorowane przez logi wyszukiwania)
– Średni czas zapytania: 8 sekund (P50), 15 sekund (P95)
– Wskaźnik „plik nie znaleziony”: 3,2% (vs 18% przed AI gdy inżynierowie się poddawali)
– Zadowolenie użytkowników: 9,1/10 (ankieta, n=42 respondentów)

 

Konserwatywna kalkulacja ROI:

 

Stosujemy 80% dostosowanie pewności (zakładając że tylko 80% prognozowanych oszczędności się zmaterializuje):

 

Koszty:
– Implementacja: 180 000 PLN (jednorazowe, faktyczna faktura)
– Koszty operacyjne roczne: 156 000 PLN (licencja 120K + infrastruktura 36K, rzeczywiste koszty)
Całkowity koszt Rok 1: 336 000 PLN

 

Oszczędności (80% pewności):
– Prognozowane oszczędności: 3 800 000 PLN/rok
– Dostosowane (80%): 3 040 000 PLN/rok
Konserwatywne oszczędności netto Rok 1: 2 704 000 PLN

 

Konserwatywny ROI:
– ROI: (2 704 000 / 336 000) × 100 = 805%
– Okres zwrotu: 336 000 / (3 040 000 / 12) = 1,3 miesiąca

 

Uwaga o twierdzeniach „86%”:
Redukcja czasu wyszukiwania różni się według typu i złożoności zapytania:

 

Rozkład zapytań (zmierzony przez 6 miesięcy, n=1247 zapytań):
Proste wyszukiwania warstw (45% zapytań): 87 min → 3 min = redukcja 96%
– Przykłady: „Znajdź nawiew HVAC na Poziomie 3″, „Pokaż ściany ognioodporne”
Koordynacja międzybranżowa (35% zapytań): 87 min → 18 min = redukcja 79%
– Przykłady: „Rozdzielnie elektryczne przy pomieszczeniach technicznych HVAC”, „Słupy konstrukcyjne wpływające na kanały”
Analiza rewizji (20% zapytań): 87 min → 22 min = redukcja 75%
– Przykłady: „Zmiany od R2 do R4″, „Co się przesunęło od ostatniego wydania”

 

Średnia ważona: (0,45 × 96%) + (0,35 × 79%) + (0,20 × 75%) = 43,2% + 27,7% + 15,0% = 85,9% ≈ 86%

 

Raportujemy 86% (zaokrąglone z 85,9%) jako realistyczne oczekiwanie dla mieszanych obciążeń produkcyjnych, nie 96% best-case tylko dla prostych wyszukiwań.

 


 

„Zapytaliśmy 'Ile i jakich wentylatorów było w hali pompowni?’ i dostaliśmy dokładną specyfikację z nazwą warstwy DWG w 4 sekundy. Ręczne wyszukiwanie zajęłoby godzinę — zakładając że w ogóle znaleźlibyśmy właściwą wersję rysunku.”
— Damian K., Koordynator Projektu

 


 

Funkcje zaawansowane: Poza podstawowym wyszukiwaniem warstw

 

1. Śledzenie zależności Xref

 

Problem: Pliki CAD referencjonują inne pliki (xrefs). Zmiany kaskadują nieprzewidywalnie.

 

Przykład:
– Rzut architektoniczny (`A-1-FLOOR-001.dwg`) jest xrefowany przez:
– Plan HVAC mechaniki (`M-1-HVAC-001.dwg`)
– Plan oświetlenia elektryki (`E-1-LITE-001.dwg`)
– Plan konstrukcyjny szkieletu (`S-1-FRAM-001.dwg`)

 

Jeśli architekt przesuwa ścianę w `A-1-FLOOR-001.dwg`:
– Czy kanały HVAC nadal pasują?
– Czy gniazdka elektryczne są wyrównane z nową lokalizacją ściany?
– Czy słup konstrukcyjny jest dotknięty?

 

Tradycyjne podejście: Email do architekta → czekanie na odpowiedź → ręczne sprawdzenie każdej branży.

 

Śledzenie xref zasilane AI:

 

Zapytanie: „Jakie rysunki referencjonują A-1-FLOOR-001?”

 

Odpowiedź (natychmiast):
– Zidentyfikowano 12 rysunków zależnych
– Automatyczna triage wpływu: identyfikuje rysunki prawdopodobnie dotknięte w oparciu o zależność xref + obecność warstwy/bloku
– Powiadomienie wysłane do koordynatora MEP do ręcznej weryfikacji

 

Uwaga: Prawdziwa geometryczna detekcja kolizji (np. „przesunięcie ściany koliduje z routingiem kanałów”) jest dostępna tylko gdy integrujemy wyjścia kolizji Navisworks/Revit lub włączamy opcjonalną analizę geometrii — nie w baseline tylko-metadanych.

CAD AI Zaoszczędzony czas: 2-3 godziny na zmianę projektową (zdarza się 10-20× na projekt)

 


 

2. Wyszukiwanie biblioteki bloków

 

Problem: Inżynierowie odtwarzają standardowe detale zamiast reużywać istniejących bloków.

 

Przykład: Potrzeba dodać symbol gaśnicy do rysunku.

 

Tradycyjne podejście:
– Przeszukiwanie biblioteki bloków firmowych (500+ bloków, słabo zorganizowane)
– Nie pamięta dokładnej nazwy bloku
– Odtworzenie od zera (20 minut)

 

Wyszukiwanie bloków AI:

 

Zapytanie: „symbol gaśnicy”

 

Odpowiedź:
– 3 dopasowane bloki: `FIRE-EXT-WALL`, `FIRE-EXT-RECESS`, `EQUIP-FIRE-10LB`
– Podgląd obrazków dla każdego
– Jedno kliknięcie wstawienie do bieżącego rysunku

 

CAD AI Zaoszczędzony czas: 18 minut × 50 użyć/miesiąc = 15 godzin/miesiąc na inżyniera

 


 

3. Detekcja konfliktów rewizji

 

Problem: Członkowie zespołu pracują nad różnymi wersjami pliku jednocześnie.

 

Scenariusz:
– Inżynier A modyfikuje `M-2-HVAC-003-R3.dwg` (dodaje 3 nowe kanały)
– Inżynier B jednocześnie modyfikuje ten sam plik (zmienia rozmiary kanałów)
– Obaj uploadują „najnowszą wersję”

 

Tradycyjny wynik: Praca jednego inżyniera zostaje nadpisana. Odkryta dni później podczas spotkania koordynacyjnego.

 

Śledzenie rewizji AI:

 

System wykrywa:
– Dwa uploady tej samej nazwy pliku w ciągu 1 godziny
– Różne liczby encji (Inżynier A: +3 kanały, Inżynier B: 0 nowych kanałów ale 5 zmodyfikowanych)
– Oznacza jako potencjalny konflikt

 

Alert wysłany:
> „Wykryto konfliktowe rewizje dla M-2-HVAC-003. Wymagana weryfikacja przed scaleniem.”

 

Koszt zapobiegnięcia błędu: Przeróbka (8 godzin) + spotkanie koordynacyjne (2 godziny × 5 osób) = zaoszczędzonych 18 godzin

 


 

Integracja z platformami BIM

 

Nowoczesna budowa używa platform Building Information Modeling (BIM):

 

Autodesk Construction Cloud (ACC)
– Rysunki 2D + modele 3D
– Śledzenie problemów, RFI, submitale

 

Procore
– Zarządzanie projektem, harmonogramowanie
– Kontrola dokumentów, bezpieczeństwo

 

PlanGrid (teraz część ACC)
– Oznaczenia w terenie, listy punchingowe

 

Nasze wyszukiwanie CAD integruje się ze wszystkimi trzema:

 

Przykładowy workflow:

 

1. Kierownik budowy znajduje problem (niewyrównany kanał w suficie)
2. Robi zdjęcie tabletem → tworzy RFI w Procore
3. RFI pyta: „Który rysunek pokazuje routing kanałów HVAC w Siatce B3?”
4. Wyszukiwanie AI osadzone w Procore automatycznie sugeruje: `M-2-HVAC-007-R4.dwg`, warstwa `M-HVAC-SUPP`
5. Rysunek załączony do RFI automatycznie
6. Wykonawca mechaniczny odpowiada w 1 godzinę (vs 1 dzień)

 

CAD AI Zaoszczędzony czas na RFI: 23 godziny (wykonawca nie spędza dnia szukając rysunków)

 


 

Opcje wdrożenia: Chmura vs On-Premise

 

Opcja 1: W chmurze (AWS/Azure)

 

Zalety:
– Szybkie wdrożenie (2 tygodnie)
– Skalowalne zasoby obliczeniowe (GPU na żądanie)
– Brak zarządzania sprzętem

 

Wady:
– Bieżące koszty API (parsowanie CAD jest wymagające obliczeniowo)
– Opłaty za wyjście danych (upload 4600 plików DWG = 50GB+)
– Opóźnienia dla dużych plików (20MB DWG zajmuje 10s uploadu)

 

Koszt: 8000 – 15 000 PLN/miesiąc operacyjnie

 


 

Opcja 2: On-Premise (Serwery firmowe)

 

Zalety:
– Jednorazowy koszt sprzętu
– Zero opłat za wyjście danych
– Szybciej dla dużych plików (sieć lokalna)

 

Wady:
– Dłuższe wdrożenie (4-6 tygodni)
– Zespół IT musi zarządzać infrastrukturą

 

Koszt: 150 000 PLN jednorazowo + 2000 PLN/miesiąc prąd

 

Break-even: 15 miesięcy (po czym on-premise jest tańsze)

 


 

Opcja 3: Hybrydowa (Parsowanie lokalne + Indeks w chmurze)

 

Zalety:
– Parsowanie plików DWG lokalnie (szybkie, brak uploadu)
– Przechowywanie metadanych w chmurze (przeszukiwalne, skalowalne)
– Najlepsze z obu światów

 

Koszt: 4000 PLN/miesiąc

 

Zalecane dla: Firm z 2000-10 000 rysunków

 


 

Bezpieczeństwo, zgodność i zarządzanie danymi

 

Jakie dane są przechowywane i gdzie

 

Tylko metadane, nie geometria:

 

Nasz indeks wyszukiwania przechowuje:
– Nazwy warstw, nazwy bloków, referencje xref
– Właściwości rysunku (tytuł, numer projektu, rewizja, data)
– Ścieżki plików, rozmiary, timestampy modyfikacji
– Wyodrębniony tekst z tablic tytułowych i atrybutów

 

Czego NIE przechowujemy (domyślnie):
– Geometria rysunku (linie, łuki, polilinie)
– Miniaturki wizualne lub obrazy podglądu

 

Opcjonalne generowanie miniaturek:
Jeśli klient włącza obrazy podglądu (dla szybszego skanowania wizualnego w wynikach wyszukiwania):
– Miniaturki niskiej rozdzielczości (800×600px PNG) przechowywane oddzielnie od indeksu metadanych
– Retencja: Taka sama jak plik źródłowy (usunięte gdy DWG jest usunięty z ACC/Procore)
– Przechowywanie: Bucket S3 z tymi samymi ACL co metadane (użytkownik widzi miniaturkę tylko jeśli autoryzowany dla pliku)
– Wpływ na rozmiar: ~50KB na miniaturkę (vs 20MB plik źródłowy)

 

Uzasadnienie: Plik DWG 20MB produkuje ~50KB przeszukiwalnych metadanych. Ta kompresja 400:1 zapewnia:
– Szybką odpowiedź zapytania (brak dużych plików binarnych w ścieżce wyszukiwania)
– Minimalny koszt przechowywania
– Zmniejszone ryzyko wystawienia danych (brak geometrii zastrzeżonej w indeksie)

 


 

Kontrola dostępu i uprawnienia

 

Izolacja projektów:

 

Rysunki każdego projektu są izolowane w oddzielnych namespace’ach bazy danych wektorowej. Użytkownicy mogą wyszukiwać tylko w autoryzowanych projektach.

 

Integracja z istniejącymi ACL:

 

Gdy wdrożone z Autodesk Construction Cloud (ACC) lub Procore:
– Wyszukiwanie honoruje istniejące uprawnienia folderów
– Jeśli użytkownik nie ma dostępu ACC do „Projekt X / Konstrukcja / Poufne”, te pliki są wykluczone z wyników wyszukiwania
– Synchronizacja uprawnień następuje co 15 minut przez API

 

Przykład:
– Kierownik projektu: Dostęp do wszystkich rysunków w przypisanych projektach
– Podwykonawca (MEP): Dostęp tylko do Mechaniki/Elektryki, brak Konstrukcji
– Recenzent klienta: Dostęp tylko do odczytu dla zestawów wydanych do weryfikacji

 


 

Retencja danych i ścieżka audytu

 

Logowanie zapytań wyszukiwania:

 

Wszystkie zapytania są logowane z:
– ID użytkownika, timestamp, tekst zapytania
– Zwrócone wyniki (ścieżki plików, nie treść)
– Czas odpowiedzi, status błędu

 

Retencja: 90 dni (konfigurowalne według wymagań zgodności klienta)

 

Przypadek użycia: Audyt ISO wymaga „kto uzyskał dostęp do rysunków bezpieczeństwa pożarowego między marcem-majem?” → Logi zapytań dostarczają pełny ślad.

 

Śledzenie dostępu do plików:

 

Gdy użytkownik otwiera DWG z wyników wyszukiwania:
– Zdarzenie zalogowane: `user@company.com otwarty M-3-HVAC-007-R4.dwg o 2024-11-15 14:23`
– Przekazane do systemów audytu ACC/Procore (jeśli zintegrowane)

 


 

Modele wdrożenia i rezydencja danych

 

CAD AI Modele wdrożenia i rezydencja danych


 

Ryzyko: Co mogłoby pójść źle?

 

Scenariusz 1: Metadane ujawniają zastrzeżone informacje

 

Ryzyko: Nazwa warstwy „SEKRETNY-PROTOTYP-V3″ ujawnia poufny projekt.

 

Mitygacja:
– Przegląd konwencji nazewnictwa warstw przed wdrożeniem
– Opcjonalne reguły redakcji metadanych (np. ukryj warstwy pasujące do wzorca `*SEKRETNY*`)
– Szkolenie użytkowników: unikaj osadzania poufnych informacji w nazwach warstw

 


 

Scenariusz 2: Wyniki wyszukiwania pokazują nieautoryzowane pliki

 

Ryzyko: Bug w synchronizacji uprawnień pokazuje ograniczone pliki nieautoryzowanemu użytkownikowi.

 

Mitygacja:
– Whitelisting (nie blacklisting): użytkownik widzi TYLKO jawnie autoryzowane pliki
– Codzienne audyty uprawnień: automatyczny skrypt waliduje ACL indeksu wyszukiwania względem ACC/Procore
– Monitoring: alerty wyzwalane jeśli zapytania użytkownika zwracają >oczekiwaną liczbę wyników (potencjalne naruszenie uprawnień)

 


 

Scenariusz 3: Usunięte pliki pozostają przeszukiwalne

 

Ryzyko: Rysunek usunięty w ACC nadal pojawia się w wynikach wyszukiwania (nieaktualny indeks).

 

Mitygacja:
– Obserwator plików w czasie rzeczywistym: usunięcie w ACC wyzwala natychmiastowe usunięcie z indeksu
– Nocna pełna synchronizacja: porównuje listę plików ACC vs indeks wyszukiwania, czyści sieroty
– Weryfikacja wyniku wyszukiwania: przed wyświetleniem pliku sprawdza czy nadal istnieje w ACC (jeśli brakuje, ukryj + zaloguj)

 


 

Typowe wyzwania implementacji

 

🚩 Wyzwanie 1: Starsze wersje AutoCAD

 

Problem: Klient ma rysunki od AutoCAD R14 (1997) do 2024 — 27 lat ewolucji formatu.

 

Wpływ: Parser zawodzi na 15% najstarszych plików.

 

Rozwiązanie:
– Wsadowa konwersja Autodesk DWG TrueView (R14 → format 2018)
– Koszty: 40 godzin pracy inżynierskiej (jednorazowo)

 


 

🚩 Wyzwanie 2: Niestandardowe nazewnictwo warstw

 

Problem: Firma przejęła konkurenta, scaliła 10 lat projektów z całkowicie różnymi konwencjami warstw.

 

Przykład:
– Firma A: `M-HVAC-SUPP` (standard AIA)
– Firma B: `WENTYLACJA-NAWIEW` (po polsku, niestandardowe)

 

Rozwiązanie:
– Niestandardowy słownik synonimów
– Klasyfikator ML wytrenowany na obu konwencjach nazewnictwa
– 95% dokładność po 2 tygodniach treningu

 


 

🚩 Wyzwanie 3: OCR tablicy tytułowej rysunku

 

Problem: Numery projektów, daty przechowywane w grafikach tablicy tytułowej (nie encjach tekstowych).

 

Tradycyjne OCR zawodzi: Tablice tytułowe mają złożone obramowania, małe czcionki (6-8pt), zmieszane z grafikami logo, zmienne układy na branżę.

 

Rozwiązanie:
– OCR Tesseract z preprocessingiem specyficznym dla CAD:
– Detekcja i usuwanie obramowań
– Normalizacja rozmiaru czcionki (powiększenie małego tekstu przed OCR)
– Dopasowanie szablonów dla popularnych układów tablic tytułowych (AIA, ISO 7200)
– Scorowanie pewności: Wyniki OCR oznaczone poziomem pewności (0-100%)
– Kolejka ręcznej weryfikacji: Ekstrakcje niskiej pewności (<75%) oznaczone do weryfikacji ludzkiej

 

Zmierzona dokładność:
– Ekstrakcja numeru projektu: 89% poprawna (vs 60% przy ogólnym OCR)
– Data rewizji: 84% poprawna
– Tytuł rysunku: 76% poprawny (zmienny przez odręczne adnotacje na starych rysunkach)

 

Ścieżka audytu: Każda ekstrakcja OCR przechowywana z:
– Bounding box obrazu źródłowego (do weryfikacji wizualnej)
– Surowy tekst OCR + score pewności
– Ręczne poprawki (jeśli zastosowane)

 

To zapewnia że recenzenci mogą zwalidować wyniki OCR względem plików źródłowych jeśli pojawią się rozbieżności.

 


 

Co się zmieniło w 2026?

 

❌ Nie możliwości AutoCAD (wyszukiwanie warstw istniało).

 

❌ Nie przechowywanie w chmurze (firmy miały pliki DWG w SharePoint od 2015).

 

❌ Nie platformy BIM (ACC/Procore istniały).

 

✅ Zespoły zaczęły indeksować metadane CAD (warstwy/bloki/xrefs/tablice tytułowe) i zapytywać je z filtrami + odzyskiwaniem semantycznym, zamiast polegać na nazwach plików i wiedzy plemiennej.

 

W 2020-2024, „wyszukiwanie CAD” oznaczało:
– Wyszukiwanie tylko nazw plików (bezużyteczne)
– Ręczne tagowanie (żmudne, niespójne)
– Pytanie starszego inżyniera (silos wiedzy)

 

W 2026:
– AI parsuje metadane DWG automatycznie
– Rozumie semantykę nazewnictwa warstw
– Krzyżowo referencjonuje xrefs i zależności

 

Wynik: Wyszukiwanie CAD przeszło z „niemożliwe” do sekund-do-minut zależnie od workflow (zapytania indeksu poniżej sekundy, 3 minuty end-to-end z otwarciem pliku).

 


 

Wnioski końcowe

 

Wyszukiwanie rysunków CAD nie jest problemem dokumentowym — to problem metadanych strukturalnych wymagający specjalistycznej ekstrakcji, klasyfikacji i indeksowania semantycznego.

 

Kluczowe wnioski:

 

1. Ogólne wyszukiwanie dokumentów zawodzi całkowicie dla plików CAD (format binarny, brak indeksowania tekstu)
2. Ekstrakcja metadanych (warstwy, bloki, xrefs) jest fundamentem
3. Klasyfikacja semantyczna obsługuje niestandardowe konwencje nazewnictwa
4. Integracja z platformami BIM mnoży wartość (czas odpowiedzi RFI ÷ 10)
5. ROI jest natychmiastowy (zwrot <2 miesiące dla zespołów 50-osobowych)

 

Dla firm budowlanych zarządzających 2000+ plikami DWG, wyszukiwanie CAD zasilane AI dostarcza mierzalne zyski produktywności i poprawioną retencję wiedzy projektowej.

 

Zainteresowany testowaniem wyszukiwania metadanych CAD na Twoich projektach? Skontaktuj się z DevQube aby omówić proof-of-concept z reprezentatywną próbką Twojej biblioteki rysunków.

 

Wyszukiwanie rysunków CAD - Skontaktuj się z DevQube

 


 

FAQ: Pytania o wyszukiwanie CAD

 

💡 Czy to działa z plikami Revit (RVT), czy tylko AutoCAD (DWG)?
Tak, wspieramy Revit. Logika ekstrakcji jest inna (Revit przechowuje dane w strukturze relacyjnej vs entity-based DWG), ale interfejs wyszukiwania jest identyczny. Wspieramy również: DXF, DGN (MicroStation), SKP (SketchUp).

 

💡 Czy można wyszukiwać wewnątrz modeli 3D, czy tylko rysunków 2D?
Oba. Dla modeli 3D (Revit, Navisworks), wyodrębniamy: rodziny, parametry, wyniki detekcji kolizji. Dla chmur punktów (RCS, LAS), indeksujemy metadane skanowania (oznaczenia urządzeń, etykiety pomieszczeń).

 

💡 Co jeśli nasze nazwy warstw nie stosują żadnego standardu?
Trenujemy niestandardowy klasyfikator na WASZYCH konwencjach nazewnictwa. Typowy zestaw treningowy: 500-1000 przykładowych warstw. Dokładność: 90-95% po 2 tygodniach.

 

💡 Jak długo trwa wstępne indeksowanie dla 10 000 rysunków?
Zależy od sprzętu. Chmura (instancja AWS g5.2xlarge GPU): 12-18 godzin. On-premise (NVIDIA RTX 6000): 8-12 godzin. Indeksowanie przyrostowe (tylko nowe pliki): w czasie rzeczywistym.

 

💡 Czy możemy zintegrować z naszą istniejącą subskrypcją Autodesk Construction Cloud?
Tak. Używamy API ACC dla dostępu do plików. Nie trzeba duplikować przechowywania — rysunki pozostają w ACC, metadane synchronizują się z naszym indeksem wyszukiwania.

 

💡 Co się dzieje gdy rysunek jest zrewidowany — czy re-indeksujemy?
Tak, automatycznie. Obserwator plików monitoruje ACC/Procore dla zmian. Gdy nowa rewizja uploadowana, indeksowanie delta aktualizuje metadane w ciągu 2 minut.

 

💡 Czy użytkownicy mogą wyszukiwać bezpośrednio z interfejsu AutoCAD?
Tak. Dostarczamy plugin AutoCAD (komenda LISP `DSEARCH`). Wpisz komendę → wprowadź zapytanie → wyniki wyświetlają się w palecie → kliknij aby otworzyć rysunek.

 

💡 Czy wspieracie śledzenie oznaczenia as-built (redlines, zmiany w terenie)?
Tak. OCR PDF z oznaczeniami, wyodrębniamy tekst adnotacji, linkujemy do źródłowego DWG. Popularny przypadek użycia: „Znajdź wszystkie otwarte elementy z ostatniej inspekcji budowy.”

 

Wyszukiwanie rysunków CAD AI: Jak firmy budowlane znajdują warstwy DWG w sekundy