Tesis:

Characterisation of Technology using Patent Citations


  • Autor: PÉREZ MOLINA, Eduardo

  • Título: Characterisation of Technology using Patent Citations

  • Fecha: 2023

  • Materia:

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: TECNOLOGIA FOTONICA Y BIOINGENIERIA

  • Acceso electrónico: https://oa.upm.es/73194/

  • Director/a 1º: RODRÍGUEZ NAVARRO, Alonso
  • Director/a 2º: LOIZIDES, Fernando

  • Resumen: La presente tesis doctoral es el resultado de una investigación en el campo de el análisis de información de patentes de invención. Estudiar la tecnología, dándole sentido a los diferentes campos técnicos y a su evolución es frecuentemente confuso y difícil de entender. Por esta razón hemos decidido observar la tecnología desde la óptica de su desarrollo en la industria utilizando para ello las publicaciones de patentes. Estudiando las patentes y sus citaciones de anticipación somos capaces de obtener una imagen clara de los campos técnicos y de su evolución y por lo tanto entender mejor la tecnología y la relación entre los campos técnicos. Esta mejora en la comprensión de la tecnología y de su evolución la hemos conseguido creando nuevas estructuras de datos y visualizaciones que preparan el camino para la predicción de futuros recorridos de la tecnología. En esta investigación doctoral se han estudiado diferentes formas de procesar la información de patentes focalizando en dos campos bien definidos, las citaciones de anticipación, que son utilizadas para enriquecer el conjunto de patentes seleccionado, y la clasificación asignada a dichas patentes y a sus citaciones, cuyos códigos se emplean para obtener las componentes tecnológicas. Para verificar y contrastar nuestras nuevas estructuras y gráficos se han estudiado en profundidad algunos casos de empresas tecnológicas y campos técnicos. Se ha analizado la función y las particularidades de la clasificación de patentes y de las citaciones de anticipación en relación a las publicaciones científico-técnicas no patentes — NPL —. A partir de dichos análisis se han definido dos nuevas estructuras de datos y sus correspondientes herramientas gráficas. La idea básica de esta tesis es caracterizar una técnica dada mimetizando la caracterización de un sonido dado utilizando su representación espectral. Usamos en nuestra investigación las componentes tecnológicas identificadas a partir de los códigos de clasificación del IPC en lugar de las componentes en frecuencia. De la misma forma que un sonido dado es caracterizado o descrito por el conjunto de valores de sus componentes a lo largo de todo el espectro de frecuencias, una técnica dada puede ser caracterizada o descrita por la importancia relativa de sus componentes tecnológicas a lo largo de conjunto completo de códigos del IPC. Pese al interés y facilidad de utilizar y analizar esta fuente tan rica y estructurada de información tecnológica que son la publicaciones de patentes, su uso por parte de la comunidad académica es escaso. La presente tesis trata de mejorar esta situación, facilitando el análisis y uso de la información contenida en las patentes, definiendo dos nuevas estructuras de datos, a saber la “Technolgy Footprint” y la “Dynamic Technology Footprint”, así como sus correspondientes utiles gráficos el “Technology Spectrum” y el “Technology Spectrogram.”. La extracción de datos de patentes se ha realizado con las bases de datos Patstat, Espacenet y Derwent-WPI. Las dos primeras mantenidas por la Oficina Europea de Patentes — EPO — y la última suministrada por Clarivate corporation. El proceso de datos se ha implementado en el lenguaje de programación Python utilizando las librerías SKlearn para para la reducción de dimensionalidad y Matplotlib para la visualización. Utilizando nuestras nuevas estructuras de datos hemos creado nuevas herramientas gráficas para visualizar características y elementos clave necesarios para entender la evolución de campos técnicos y empresas de tecnología. El parecido forma de nuestras herramientas con la representación espectral de ondas acústicas tiene importantes consecuencias porque permite el uso casi directo del conjunto del proceso de datos ya disponible para espectros y espectrogramas en nuestras herramientas, y en consecuencia al proceso de información de patentes. En esta tesis hemos utilizado tanto el “Technology Spectrum” como el “Technology Spectrogram.” para caracterizar campos tan diversos como las tecnologías médicas, la mecánica , las telecomunicaciones o la computación, así como para caracterizar la tecnología desarrollada por algunas empresas tecnológicas de dichos sectores. Además hemos desarrollado dos aplicaciones que emplean nuestras herramientas; la primera para evaluar el grado de integración de una tecnología y la segunda para generar mapas de tecnología. La contribución de esta tesis creando nuevas herramientas para el analysis y estudio del avance tecnológico usando la información de las patentes está dirigida tanto a historiadores como a managers de tecnología ya que facilitan la exploración de sus orígenes, su evolución temporal y su relación con otros técnicas. Pensamos que el trabajo que hemos realizado, más allá de servirnos para entender la evolución de campos técnicos, empresas o investigadores podría facilitar la creación de modelos predictivos del avance tecnológico. ABSTRACT The present PhD thesis is the result of research in patent information analytics. Studying and sense-making of different technical fields and its developments are often unclear and difficult to understand. For this reason, we have chosen the study of the most fundamental practice of technology evolution within the industrial world; namely, that of patent publications. We show that through studying patent publications and their references, we are able to create a clearer landscape of the evolutionary qualities of these technologies and therefore both understand and relate them to similar others. From our work, we are able to demonstrate better understanding through novel data structures and clear bespoke visualisations and pave the way to standardising models for future predictive capabilities of technological paths. During this research different ways of processing data information were studied. The research focus on two specific patent information, the patent classification information and prior art citations. The prior art citations are used to enrich the set of patents to study, and the classification codes are used to compute the technological components. Some study cases comprising a plurality of tech companies and technical fields were carried out to verify and contrast our new data structures, graphical tools and results. The function, particularities and uniqueness of patent classification information and prior art citations are analysed in relation to scientific non-patent literature — NPL — , and as a consequence two new data structures and graphical tools were defined and built. The basic idea of this research is to characterise a piece of technology by mimicking the characterisation of sound waves by its spectral representation. In our search, in place of the frequency components, we use the technological components corresponding to the assigned IPC classification codes. In the same way that a sound is characterised or described by the values of the frequency components along the whole spectrum range, a piece of technology could be characterised or described by the relative weight or importance of each technological components along the whole range of classification codes at each IPC level. Despite the interest of analysing this high rich and structured technological information brought by patent literature, and the availability to access patent information through computerised databases there is a lack of exploitation of patent information by the academic research community. The present PhD research tries to improve this situation by defining two new data structures, and its corresponding graphical tools facilitating the analysis and use of patent related information. Therefore, we have defined two new data structures — Technology Footprint and Dynamic Technology Footprint — and the corresponding visualisation tools —Technology Spectrum and the Technology Spectrogram — . At an experimental level, we have extracted all the patent data from PATSTAT, SPACENET and Derwent-WPI. The first two databases are from the European Patent Office, and the third is a patent database from Clarivate corp. The data processing was done in Python using the library SKlearn for dimensionality reduction and Matplotlib for visualisation. Using our bespoke data structures, we create our visual tools to represent key features and elements needed to understand the technological paths of different technologies and companies. The formal similarity of our tools with the spectral representation of acoustic waves has deep implications because it brings the potentiality of straightforward use of the whole range of processing available for the frequency spectrum and spectrograms to our tool, and therefore to the analysis of patent information. Both, our tools, the TechSpectrum and the TechSpectrogram have been used in this research to characterised different technical fields such as a medical technology, mechanics, telecom or computing technologies, as well to characterised some tech companies. Moreover, two applications of these tools were explored. The first to assess technology integration, and the second to generate technology maps. The contribution of this Thesis by using the newly created data structures, through analyses using our bespoke visualisation tools, enables the clear exploration of both the history as well as evolution of technological advancement. We also present specialised case studies giving applied examples of the working of our systems such as the evolution factors of computerised tomography, detailed with the elements of what specific techniques were adopted to change the landscape. We are able to give an in-depth visual analysis of three leading medical technology companies, and how their adoption of technologies fit into the generic adoption landscape of the time. In future, we hypothesise that the work we have produced, will, beyond understanding the evolution of technical fields, tech companies or researchers over time, be able to also give predictive modelling of behaviours that will estimate direction of different industrial players.