In a previous post on the leaked “Digital Omnibus” draft, I played with the idea hidden in noyb’s name: None of Your Business – in other words, irrelevant. My point was that the GDPR already contains, in plain sight, a principle that should be at the core of the debate but is almost never mentioned: Article 5(1)(c)’s demand that data be adequate, relevant and limited to what is necessary in relation to a purpose. The real question is not how much “personal data” the law can cover in the abstract, but which data are any controller entitled to take into account for a given decision.
Since then, the Digital Omnibus proposal has been published, and noyb has issued a long report criticising it. The public debate has largely been framed as a familiar clash: on one side, a Commission accused of “watering down” the GDPR by narrowing the definition of personal data and creating new exceptions for AI and research; on the other, civil-society actors defending a maximal scope for “personal data” and a strong version of data minimisation.
In this post I want to argue that this is the wrong axis of conflict. Both sides are fighting over how broad the law’s coverage should be, while largely ignoring what the law was actually designed to control. The Omnibus debate is being treated as a war over definitions, when it should be treated as an opportunity to recover the original focus of data protection: the fairness of decisions about individuals, and the prevention of their being made on the basis of irrelevant data.
To make that case, I will first say something about the “maximal scope” paradigm that dominates current criticism of the Omnibus. I will then turn to the research and AI provisions, explain why both the Commission and noyb mis-locate the risks, and finally suggest a different way of looking at scope – one that re-reads “processing of personal data” in line with its directive-era function.
A central target of current criticism of the Digital Omnibus proposal is the suggested rewording of Article 4(1) GDPR, the definition of “personal data”. In noyb’s reading, the new text would introduce a strongly controller-relative element into identifiability: whether information is “personal data” would depend on the specific controller’s perspective, resources or reasonable efforts. Pseudonymised data held by actors who lack re-identification keys might therefore fall outside the definition for them, even if another actor could identify the same records.
For noyb, this is not just an unfortunate drafting choice but a constitutional problem. The reasoning, roughly, is as follows:
On this view, the definition of “personal data” in Directive 95/46/E.C., as interpreted in landmark CJEU judgments, has been effectively “constitutionalised” by Article 8 of the Charter. And what is “constitutionalised” is understood as the breadth of the definition: the more generously we interpret “any information relating to an identified or identifiable natural person”, the more robust the protection of Article 8 must be.
From this vantage point, the only safe strategy is to insist that almost any information that can, in some chain of events, be linked to an individual must be treated as “personal data”, and that almost any operation involving that information must be treated as “processing”. The Omnibus proposal is thereby cast as an attempt to introduce controller-relative “subjectivity” into what ought to remain an objective, all-encompassing definition – a move that would undermine legal certainty, fragment enforcement and invite a race to the bottom.
I will call this way of thinking the maximal scope paradigm: the belief that the primary way to protect fundamental rights is to push the conceptual reach of “personal data” and “processing” as far as possible and then defend that maximal line against any retreat. Different actors occupy this paradigm in different ways – NGOs like noyb, some authorities and parts of the academic debate – but what they share is the assumption that “more situations legally qualifying as processing of personal data” almost automatically means “more effective protection.”
Historically, however, the normative focus of European data protection instruments has never been “data as such”. It has been the use of data in systems of decision-making: credit scoring, employment screening, social security adjudication, policing, risk assessment, and so on. The early data protection laws, as well as their international precursors, were motivated by concerns that automated or computer-supported decisions about individuals could be made in opaque ways, based on incomplete, irrelevant or biased information, compiled in powerful, centralised files.
This orientation is visible in two features that are often overlooked in current debates.
First, the concept of processing was originally tied to what one might call an informational pipeline: a systematic sequence of operations through which data are collected, stored, combined, analysed and used to support decisions or actions. It was this pipeline – and the risks it created for individuals subjected to it – that justified a set of procedural and substantive constraints. The inclusion of “collection”, “use”, “disclosure” and “erasure” in the definition was meant to capture the different stages of that pipeline, not to transform any isolated mention of a person’s name into “processing” in the full legal sense.
Secondly, the much-cited triad of “adequate, relevant and not excessive” was framed as a data quality principle for decision-making. Its function was to ensure that decisions affecting individuals are based on information that has a rational link to the purpose of the decision, that is sufficiently complete and accurate for that purpose, and that does not include extraneous or prejudicial details. The idea was not to minimise data in the abstract, but to constrain the informational basis of decisions so that they are fair, non-arbitrary and non-discriminatory.
If one keeps this decision-oriented perspective in view, the relation between scope and protection looks different. What matters is not primarily how many pieces of information fall under the label “personal data”, but which informational pipelines and which decision contexts are brought within the reach of data protection law. A conception of “processing” that indiscriminately covers everything from one-off journalistic mentions to complex, automated profiling systems may be rhetorically expansive, but it risks obscuring precisely those structural features – centralisation, automation, iterative use – that generated the need for a specific legal regime in the first place.
From this angle, the maximal scope paradigm is problematic in two ways.
It is over-broad, in that it extends the full conceptual and doctrinal apparatus of “processing of personal data” to contexts where the characteristic risks of data protection law are only marginally present. Treating every isolated reference to an individual, every casual photograph, or every transient log entry as “processing” subject to the GDPR may be logically possible under a literal reading of “any information relating to…”, but it stretches the concept far beyond the original risk profile it was designed to address. In doing so, it invites either pervasive non-compliance in everyday life or the proliferation of exceptions and derogations, which in turn make the law more complex and less intelligible.
At the same time, it is under-protective where protection is most urgently needed. By focusing energy on defending the outer conceptual perimeter of “personal data”, it diverts attention from the internal structure of those processing operations that truly matter: large-scale profiling, scoring and decision-support systems. Here, the crucial questions are not whether some fragment of information can be said to “relate” to an individual in the abstract, but whether the overall pipeline of processing is structured in such a way that decisions about individuals are based on adequate and relevant data, subject to meaningful contestation, and constrained by clear prohibitions on certain kinds of inferences.
Put differently, insistence on an ever-expanding notion of “personal data” risks functioning as a substitute for the harder work of identifying, and regulating, those decision contexts that require heightened protection. It can make it politically easier to denounce any perceived narrowing of scope – such as controller-relative identifiability in Article 4(1) – without having to say very much about which kinds of processing the fundamental right to data protection actually targets, and why.
To get out of this dead end, we need to recall that data protection law has always worked on two layers at once:
The rest of this post will unpack this two-layer structure and show how it helps to reframe the Omnibus debates about scientific research, AI and personal data definitions.
A second focal point of the Omnibus debate is the proposed new definition of “scientific research” in Article 4(38) and the accompanying changes to purpose limitation and information duties, notably Article 13(5). The Commission’s draft defines scientific research, in essence, as “any research” that “can also support innovation”, supplemented by a long list of criteria referring to growth of society’s “knowledge and wellbeing”, adherence to “ethical standards in the relevant research area”, and similar elements.
noyb’s report offers a sharp and, in many respects, justified critique of this approach. It points out that:
On this basis, noyb argues that the proposed definition, combined with an expanded framework for research exemptions, amounts to a “blanket allowance of further processing for a broadly and ill-defined ‘research purpose’”, which would likely fail the Charter’s requirements of necessity and proportionality. The Commission appears, in this reading, to be sacrificing the Article 7 and 8 rights on the altar of an amorphous “innovation” agenda.
At first glance, this critique appears squarely aligned with a rights-protective stance. Yet its internal logic again rests on two familiar premises: first, that the core of data protection is data minimisation as a direct emanation of Articles 7 and 8 and Article 52(1), and second, that the main threat posed by an overbroad research definition is the erosion of this minimisation and of purpose limitation as such. The questions of which types of research, and which decision contexts, ought to fall under stricter scrutiny remain largely implicit.
A decision-oriented perspective – one that takes seriously the role of adequacy and relevance in decision-making – suggests a different way to cut the problem.
On the one hand, there are forms of research that do not themselves feed into concrete decisions about identifiable individuals. Classic statistical and scientific uses of data, where the outputs are aggregate patterns, coefficients or models describing populations, may raise important issues of ethics, distributive justice and epistemic bias. But in terms of data protection, their risk profile is largely mediated by what happens after research: whether and how the resulting insights are embedded into operational decision systems.
On the other hand, there are forms of research that are structurally wired into treatment decisions: credit risk models developed on customer databases, hiring algorithms trained on past applicants, insurance pricing models, fraud detection tools. Here, the line between “research” and “operation” is thin. The same structured datasets used to develop the models are used, or readily usable, to support consequential decisions about individuals.
In this second family, what matters for data protection is not that “research” in the abstract uses more data than strictly necessary, but that the resulting decision systems may operate on data that are not relevant to the decision purpose. The core risk is arbitrary or discriminatory treatment: music taste influencing credit limits, social media activity affecting hiring, neighbourhood proxies standing in for ethnicity in insurance pricing. These are precisely the kinds of problems the adequacy and relevance requirement was originally meant to prevent.
From this angle, the Omnibus proposal’s changes to Article 4(38) and 13(5) are problematic, but not primarily because they offend an abstract ideal of data minimisation. They are problematic because they:
noyb’s critique rightly attacks the vagueness of the definition and the risk of “innovation” being used as a carte blanche for further processing. But by casting the issue mainly in terms of Charter-compliant data minimisation, it misses the opportunity to ask the decisive question: which research-generated datasets are likely to flow into decision contexts, and how should their re-use be constrained to prevent irrelevant or discriminatory decision-making? This is the perspective I developed in my earlier post on the Omnibus debate, where I argued that both the Commission and noyb tend to overlook the GDPR’s explicit relevance requirement in Article 5(1)(c).
The same pattern recurs, in sharper form, in the Omnibus proposal for Article 9(2)(k) and (5), dealing with AI and special categories of data. The draft introduces a new derogation for “processing in the context of the development and operation of an AI system … or an AI model”, accompanied by a paragraph 5 that requires controllers to implement “appropriate organisational and technical measures” to avoid the processing of special categories in training, testing and validation, and to remove such data where identified, or at least to prevent them from influencing outputs or being disclosed if removal would require disproportionate effort. The proposed recital 33 expressly frames this as a derogation from the Article 9(1) prohibition “in order not to disproportionately hinder the development and operation of AI”.
noyb criticises this structure on familiar grounds. It argues that AI is precisely the kind of opaque, large-scale processing that the data protection principles were originally designed to constrain; carving out a new derogation for AI development and operation is therefore backward-looking and threatens to hollow out the very safeguards that were written with such systems in mind. It also points out the loose drafting (“in the context of”, “appropriate measures”, “disproportionate effort”) and the risk that the derogation becomes a general permission for AI developers to retain special categories so long as they can claim to have implemented some minimisation efforts.
Again, this line of attack is understandable, but it presupposes that “AI development” is a unitary activity and that the relevant Charter risk can be captured by the volume and sensitivity of data processed. The actual situation is more complex.
As I argued in that earlier blog post, the label “AI development” currently covers two fundamentally different activities:
Treatment AI, such as credit scoring, hiring and insurance models, trains on genuine systematic datasets: customer or candidate databases that are prototypical “personal data” in the sense of data protection law. Here, database-oriented requirements make structural sense: minimise unnecessary special categories in training sets, remove them where inappropriately included, protect the sensitive training data against disclosure or misuse.
Generative AI training on public web text, by contrast, operates on scattered fragments of already public information to extract statistical patterns. It does not create systematic individual records; the resulting models do not, in normal operation, contain addressable records of specific persons’ sensitive characteristics. The main risks lie not in disclosure of special categories about identified individuals, but in the amplification of biases and stereotypes in generated content.
For the second family, Article 9(5)’s requirements are simply mis-specified. Instructing controllers to “remove” special categories from a corpus of heterogeneous web pages assumes a database-like structure that does not exist: what exactly is to be removed – sentences, paragraphs, entire documents? The “where possible” qualifier acknowledges the impracticality without providing a coherent standard. The language about preventing “disclosure” of special categories presupposes a context in which disclosure means revealing specific individuals’ sensitive data from a controlled database, not producing new text in which health or religion are mentioned in the abstract.
By lumping these structurally different activities together under a single derogation, the Omnibus proposal repeats the conceptual conflation already visible in the personal data definition. At the same time, and more importantly from a decision-oriented viewpoint, it misplaces regulatory attention:
Generative AI training on scattered public text, which normatively should not be treated as personal data processing at all because it never constructs systematic datasets suitable for decisions about individuals, becomes the direct target of impractical, database-oriented requirements.
Treatment AI operation, where structured datasets are used to make consequential decisions about individuals, receives relatively little targeted attention. Article 88c recognises AI operation as a legitimate interest, but provides no mechanism to enforce the relevance requirement of Article 5(1)(c) in this context. Irrelevant characteristics such as music preferences, social media activity or religious affiliation may thus be factored into decisions under the banner of “legitimate interest”, subject only to an individual right to object.
In short, both the Omnibus proposal and much of its criticism, including noyb’s, focus on how much and what kind of data AI systems may process, while leaving largely untouched the question whether the data used in AI-supported decisions are relevant to the decision purpose and how to prevent cross-context re-use of data in ways that generate arbitrary or discriminatory outcomes. That is precisely the gap that a relevance-based reading of Article 5(1)(c) is meant to fill.
At this point the obvious question is: if both the Commission and noyb are framing the problem in the wrong way, what would a better treatment of research and AI actually look like? It seems clear that one political driver of both the new research definition and the AI derogation in Article 9(2)(k) – and of the attempt to redefine personal data – is the fear that, under the current reading of “processing of personal data”, even web-scale AI training and other large-scale analytics are automatically sucked into the full GDPR regime.
My answer is essentially the same as in my earlier post on the leaked Omnibus draft, but extended to the new definition and AI proposals.
Keep the existing statistical/research framework for the learning phase.
Europe already has a coherent way to deal with large-scale analysis that does not itself feed into decisions about individuals: the combination of
the “compatibility” rule for statistical and scientific purposes in Article 5(1)(b) GDPR; and
the older Council of Europe framework on statistical processing, which allows restrictions of individual rights as long as no decisions or measures concerning individuals are taken on the basis of the statistical results.
AI training belongs here. Training a model on large datasets is, in substance, statistical processing. In this phase there is, by definition, no concrete decision purpose yet, so it makes little sense to apply a relevance test at the level of the model or its inputs. The adequacy and relevance requirement is a constraint on the informational basis of decisions, not on the structure of models in the abstract. The core protected interest is not offended simply because a learning algorithm has “seen” certain variables; it is offended when those variables are actually used as part of a decision pipeline about individuals.
This distinction is crucial. A model may internally contain parameters influenced by many features, including features that would be irrelevant if used explicitly at decision time. What matters for data protection is which data are in fact taken into account when deciding about a person – which variables are read, combined and acted upon in the operational system. The legal architecture should therefore be very simple:
learning / training = statistical or research processing, covered by existing rules for such purposes, on the strict condition that the outputs are not used directly to decide about individuals;
operation = decision-making, subject to full data-quality scrutiny, including a serious enforcement of “adequate, relevant and not excessive” under Article 5(1)(c) with respect to the inputs actually used in the decision.
No special AI derogation is needed – and a broad one would be harmful.
If we treat AI training as statistical processing and AI operation as ordinary (but highly consequential) decision-making, there is no need for a new, AI-specific derogation in Article 9(2)(k) or elsewhere. On the contrary, a blanket derogation “for AI development and operation” risks doing exactly what I criticised in my previous post: it invites controllers to invoke “AI” as a magic keyword to justify both phases at once, while never asking the simple question at the operational phase: are the data we actually use in these AI-supported decisions relevant to the decision purpose?
Special categories do not need an AI-only regime either.
For the learning phase, the right question is not “how can we purge every trace of special categories from web-scale training corpora?”, but “how do we make sure that training corpora used for statistical purposes are not casually re-purposed into decision systems where special categories – direct or inferred – would be irrelevant to the decision purpose?”.
For the operation phase, if relevance is properly enforced, the distinction between directly revealed and inferred sensitive data becomes less important: both are ruled out wherever they are “none of your business” in light of the decision purpose. The problem, as I argued in the earlier post, is that we are currently trying to slim down Article 9 without first building the enforcement muscle around relevance at the decision layer.
In other words, instead of inventing AI-specific exceptions and research-specific shortcuts, we should put AI training back where it belongs – under the existing statistical/research framework – and concentrate regulatory energy on AI operation, where the relevance requirement finally has to be taken seriously at the point where decisions are made.
The discussion so far already suggests that data protection operates on two interlocking layers:
We can now make this structure more explicit and ask how the Omnibus proposals affect each layer.
From a functional perspective, EU data protection law operates on two distinct but interdependent layers.
First, there is direct governance of decisions. Whenever personal data are actually used to make or support decisions about individuals, data protection law requires that the informational basis of those decisions meets the traditional data-quality standard: the data must be adequate and relevant to the purpose of the decision and not excessive. In modern language, there must be a rational link between the data items used and the legitimate decision purpose. This is where the classic “adequate, relevant and not excessive” formula belongs: it is a constraint on how decisions are made, not an abstract call to minimise data.
Second, there is preventive governance of data flows. Purpose limitation, restrictions on further use and onward disclosure, and the construction of “data silos” are not mysterious relics of a bygone era of database regulation. They are ex ante tools designed to prevent future violations of adequacy and relevance. The empirical intuition is simple:
Once data start to flow into new contexts, the probability that they will be re-used in decisions for which they are not relevant rises sharply.
If a dataset collected for one clearly defined purpose can be repurposed, combined and traded without structural constraints, it is only a matter of time before some actor uses it as input for decisions to which the data have no rational connection – credit scoring based on music taste, insurance pricing based on social media activity, hiring decisions based on political affiliation, and so on.
Seen in this light, purpose limitation is not a decorative recital about fairness. It is the central legal mechanism through which the law tries to shape the future graph of data flows: to determine which data can realistically end up feeding which decision systems. The decision layer governs the content of decisions (adequacy and relevance); the flow layer governs the routes through which data can travel into decision contexts in the first place.
Any attempt to redraw the boundary of “personal data” therefore has two effects:
The risk of the Omnibus proposal on personal data definitions is best understood at this second level.
The Omnibus proposal does not invent the idea that personal-data status may depend on the means of a particular controller; it codifies the Court’s relative approach, especially as expressed in more recent case law. The core idea is that information counts as personal data for a controller only if that controller has means that are “reasonably likely to be used” to identify the individuals concerned. Pseudonymised datasets held by actors who lack re-identification keys might therefore fall outside the definition for them, even if another actor could identify the same records.
On its face, this move is presented as a technical solution to a real problem: without some relativisation of identifiability, any data that someone could link to a person risks being treated as personal data for everyone. But once we look at the two-layer structure, a different picture emerges.
Consider a stylised scenario. A company collects information on music preferences – whether customers prefer jazz, rock or classical – linked to stable internal identifiers. At the time of collection, it pseudonymises the data and declares that they are used purely for market research. Under a relative definition, the company might argue:
If accepted, this position has a crucial consequence: purpose limitation never attaches to the dataset. The data have been collected and processed in structured form, but as long as they are treated as “non-personal” for that controller, the entire flow-governance layer of data protection simply does not apply.
Fast-forward several years. The company changes strategy and enters the credit-scoring market. It discovers that music preference correlates, in its dataset, with repayment history. It now has strong incentives to:
At that moment, the company will insist that it now has identification means and that the data now constitute personal data. But purpose limitation will be invoked too late. Because the data were originally classified as “non-personal”, there was no legal obligation to tie their collection and retention to a specific, limited set of purposes, or to treat later re-use for credit scoring as a purpose change requiring a fresh legal basis and renewed guarantees for the individuals concerned.
This is not an exotic edge case. It describes a systematic pattern of “purpose drift through claimed non-identification”:
The same logic applies not only to isolated companies, but to entire chains of actors. If upstream entities can treat rich, individual-level structured datasets as “non-personal” on the basis that they lack re-identification keys, those datasets can circulate freely until they reach actors who do have the means and incentives to link them to identified persons and embed them in decision systems. Purpose limitation was meant to constrain exactly such cross-context flows; a relative definition makes it easy to step outside its reach during the most critical stages of dissemination.
The Omnibus proposal’s empowerment of the Commission to designate certain categories of pseudonymised datasets as “non-personal” through implementing acts would exacerbate this risk. Once such a designation is made, entire classes of structured data can travel as if they were mere technical exhaust, while remaining perfectly suited for later reintegration into decision pipelines. What disappears is not only some marginal transparency duty; it is the ex ante requirement to ask, at each step of the flow, “what purposes justify moving these data into this next context?”
From a decision-and-flow-oriented perspective, then, the danger of the Omnibus redefinition is not primarily that it makes the GDPR less “broad” in an abstract sense. It is that it removes structured, decision-capable datasets from the preventive flow-governance layer at precisely the stages where that layer does its most important work.
At the same time, it is worth recalling that the GDPR already contains a gate in the form of its material scope clause. Article 2 confines the Regulation to the “processing of personal data”. The popular complaint that “the GDPR applies to everything” does not stem from the absence of such a gate, but from the way in which “processing” has gradually been flattened into “any handling of any information about a person” – including, in the political imagination, web crawling for AI training or other large-scale analytics. The Omnibus proposals take this perception of overbreadth at face value and try to cure it at the level of the definition of personal data itself. The maximal scope paradigm reacts from the opposite direction and defends the broadest possible reading of “personal data” and “processing”. What both moves have in common is that they leave the structural notion of processing untouched – and with it, the original idea that the material scope of the GDPR was meant to capture systematic, file-like processing pipelines, not every scattered mention of an individual.
Against that background, if we take seriously both layers of protection, an alternative way of framing the scope question suggests itself. Rather than asking how far we can conceptually stretch the notions of “personal data” and “processing”, we should ask in which situations EU data protection law must, at a minimum, apply with full force across both layers.
A decision-and-flow-oriented test could be formulated, in preview, along these lines:
Systematic pipeline
There must be a systematic informational pipeline in the original sense of “processing”: a structured sequence of operations on data organised according to stable categories or formats, not merely isolated mentions or ad hoc exchanges. This is the threshold that distinguishes “data” from scattered “information” and captures what early data protection instruments were designed to regulate.
Decision context
The outputs of this pipeline are, or are reasonably likely to be, used in decision contexts that affect individuals’ legal or social position: credit, employment, insurance, social benefits, access to services, law enforcement, and comparable domains. Here the decision layer kicks in: Article 5(1)(c) must be interpreted and enforced as a genuine relevance requirement, demanding a rational link between each category of processed data and the stated decision purpose.
Cross-context flow risk
The data in the pipeline can realistically flow into other decision contexts in which they would not be relevant, unless purpose limitation and onward-transfer rules apply. Where such cross-context drift is structurally plausible – as in large-scale analytics, AI development and platform ecosystems – the flow layer should apply from the moment the data are collected in structured form, regardless of whether the controller currently claims to have identification means.
On this view, the problem with the Omnibus redefinition of personal data is not that it abandons an abstract ideal of maximal scope. The problem is that it allows controllers to step outside this three-part test at will by declaring, at collection time, that they lack identification means – even when they are building exactly the kind of structured datasets that can later be fed into consequential decision systems. Once those datasets are born outside the legal category of “personal data”, the law’s ex ante capacity to shape their future flows is crippled.
The same test also helps to separate, conceptually, different families of AI-related processing. Generative-AI training on scattered public text corpora may fail the first and third prongs: it does not create systematic, individual-addressable datasets, and its outputs are not naturally wired into decision contexts. By contrast, treatment AI – credit scoring, hiring algorithms, insurance pricing models – falls squarely within all three: it operates on structured records, directly supports decisions about individuals, and its datasets have obvious cross-context re-use potential.
This interpretive proposal is not a call to rewrite the text of Article 4(1) GDPR. It is a call to re-read the existing concepts of “processing of personal data” and “personal data” in light of their directive-era function.
Historically, the structural understanding of “processing” was not an accidental by-product of outdated “file” concepts. The Commission’s 1990 proposal still spoke the language of files, but when the Parliament insisted on replacing “file” by “processing of personal data”, this was not meant to abandon the structural requirement altogether. It was meant to capture file-like processing pipelines, including on-the-fly decision systems that reproduce the same risks without a literal, centralised file. The shift from “file” to “processing of personal data” thus extended the concept along a functional line, rather than dissolving it into “any handling of any information”.
Some judgments – particularly in borderline cases – can be read as stretching the concept for specific factual constellations without turning “processing” into “any handling of any information” as a general rule. Where genuine tensions remain, they suggest that the Omnibus is premature in constitutionalising a maximalist scope at precisely the moment when the underlying concept still requires careful doctrinal clarification.
If you only read the open letters and press releases around the Digital Omnibus, it looks like a familiar drama. On one side, the Commission, accused of “watering down the GDPR” by narrowing the definition of personal data and creating new derogations for AI and research. On the other side, noyb and others, defending a maximal scope for personal data and a strong version of data minimisation.
My argument in this post, building on my earlier analysis, is that this is the wrong axis of conflict. Both sides are fighting over how broad the law’s coverage should be, while largely ignoring what the law was actually designed to control. From the 1970s onward, European data protection law was not about “data” in the abstract. It was about systems of decision-making: the pipelines through which structured data are collected, organised and used to allocate jobs, credit, insurance, social benefits and other advantages and burdens.
Seen from that angle, the core of the GDPR is not an abstract horror of “too much data”, but a pair of linked questions: which data may legitimately be taken into account in decisions about individuals, and how should we prevent data from flowing into decision contexts where they have no rational link to the purpose? That is what the data-quality principle and purpose limitation were originally built to address.
At this point, two natural questions may arise.
The first is that this may still sound like data minimisation by another name. After all, Article 5(1)(c) GDPR now literally speaks of data being “adequate, relevant and limited to what is necessary in relation to the purposes for which they are processed”, and Directive 95/46/EC already spoke of “adequate, relevant and not excessive”. Hasn’t the law always been about minimising data?
My answer is that, historically, this triad was framed as a data-quality principle for decisions, not as a free-floating command to collect “as little data as possible”. “Not excessive” – and its later rephrasing as “limited to what is necessary” – was embedded in a standard that also demanded adequacy and relevance for a given decision purpose. Supervisory guidance often glosses “adequate” as “sufficient to properly fulfil your stated purpose”. But “sufficient” sometimes means more data, not less: more complete income information to avoid arbitrary denials of credit, more context to avoid misinterpreting a single data point, more nuance to prevent crude profiling. A pure minimisation reading, which treats “less data” as always better from a fundamental-rights perspective, erases this ambivalence and collapses adequacy and relevance into a one-dimensional “volume” metric. In that light, rebadging Article 5(1)(c) as the data minimisation principle is itself part of the problem: it obscures the original focus on relevance and sufficiency for decisions, and makes it easier to overlook situations where better protection in fact requires better – not thinner – data.
A second, closely related question is whether all this ultimately collapses into a call to strengthen Article 22 GDPR on automated decision-making. The recent battles around Article 22 are, in a way, a symptom of the same misframing. Because we forget that the data-quality principle already governs the informational basis of all decisions that take personal data into account, there is a tendency to load every concern about profiling and AI onto the narrow category of “solely automated” decisions in Article 22. One camp therefore demands an ever broader Article 22, hoping it will cure problems that actually belong in the general regime of Article 5(1)(c). Another camp concludes that Article 22 is an overreach that stigmatises even proper profiling that respects adequacy and relevance, and pushes to hollow it out or abolish it – a mood that is not entirely absent from the Omnibus debates.
What both sides risk forgetting is that Article 22 is a lex specialis for a very small subset of cases. The basic standard I have tried to reconstruct here is more general and more basic: it applies whenever personal data are used in decision-making at all, regardless of the mix of automation and human involvement. That standard lives primarily in Article 5(1)(c) and the surrounding data-quality and purpose-limitation provisions, not in Article 22. Strengthening Article 22 cannot substitute for taking the relevance requirement seriously across the board. Weakening Article 22 does not make decision systems benign if we continue to ignore adequacy and relevance at the decision layer and to relax flow governance so that irrelevant data can silently seep into consequential decisions.
Against that background, the real promise and danger of the Digital Omnibus become clearer. The promise is that the current controversy could have forced us to reopen the basic questions: what counts as “processing of personal data” in the structural sense? where do the characteristic risks of data protection actually arise? how should we distinguish statistical or learning phases from operational decision-making? The danger is that we instead constitutionalise a maximalist reading of scope at the very moment when the underlying concept of processing still needs careful doctrinal work – and, at the same time, quietly open back doors for exactly those structured datasets that most urgently require tight flow governance.
The alternative sketched in this post is modest in textual ambition but radical in effect. It does not call for rewriting Article 4(1); it calls for re-reading “processing of personal data” and Article 5(1)(c) in line with their directive-era function. It suggests that AI training should be treated as statistical processing under existing rules, and that the real regulatory energy should be directed at AI operation and other decision systems, where the adequacy and relevance requirement finally has to bite. And it suggests that both the Commission and its critics would do better to shift their attention from how far the legal concept of personal data can be stretched, to how the law governs the pipelines by which data flow into decisions. That, after all, was what data protection was for.
本来であれば、学術論文の形で発表すべき(根拠となる文献をふんだんに引用して*1)ところであり、実際その執筆作業は一部進めているのだが、何ヶ月もかけて悠長にしていられる状況ではない。EUの政治は今まさに動いており、このままでは混迷を深めるばかりで、もはや今のEDPB・EDPSでは頼りになるとは期待しがたい*2。仮名化データを個人データとみなすかどうかは、GDPRの立法過程でも争点となったところだし、そもそも欧州評議会1997年勧告の段階で既に認識されていた課題である。CETS 108以来の「データ品質」原則が、GDPRの立法過程でドイツ的な誤訳を経た「データ最小化」原則へと捻じ曲げられ、それを当時の欧州理事会が辛うじて押し返していたことも、今となっては欧州でどれだけ共有されているのか心許ない。前回の投稿について思い切ってドイツのレジェンド教授にメールでお伝えしたところ、なんと、すぐに読んで頂けたようでお返事があり、称賛のお言葉とともに、わしはもう歳じゃから君がやりなさいとの励ましを頂いた。
そんなわけで、取り急ぎ大規模言語モデルの力を借りて、あちらの人たちに刺さる表現になるよう工夫して生成したのが上に掲載した英語ブログである。これは以下の手順で生成した。まず、前回の続きでClaudeに書かせていたのだが、イマイチあちらに刺さる感じに仕上がらなかったのでボツとし、ChatGPT(5.1)に一から書かせた。ChatGPTの調査力はかなり(特に8月のGPT-5以降)良く、ここ半年はChatGPTをメインに調査していたので、そのメモリー機能によってChatGPTは、私がどういう調査をしてどのような立場なのかを概ね把握しているようであり、何も言わなくても大筋の判断はできてしまうようだった。それでも材料が足りなかったので、ボツにしたClaude原稿(それは私の既発表論文群をソースにして生成されている)を読ませて観点を補充し、最終的にこちらから足りない要素を指摘して補完させ、完成に至った。
そのプロンプトを以下に開示しておく。完成版の日本語訳(Claudeによる翻訳)は最後に置いたので、結論から読みたい人は最後のターンまでスキップするとよい。
(略)
もし必要なら、あなたの立場(processing 概念やスコープ論)から見て「ここは使える/ここはずれている」という仕分けも、条文ごとにやっていきましょう。
記号はこんな感じで付けています:
(略)
ざっくり言うと、この Digital Omnibus レポートは「GDPR=Charter 7/8条の最大限のスコープを死守する」という立場に振り切れていて、あなたの「決定指向+スコープを整理する」路線から見ると、ツッコミどころの宝庫です。
以下、「こういう点で noyb がダメ、本当はこう考えるべきだ」という形で、論点ごとに“使い方”を書きます。
(略)
とりあえず「どういうストーリーで書けば欧州方面に刺さるか」を、かなり具体的に組み立ててみます。
(略)
(略)
別途Claudeに書かせた原稿案がある … 参考になる要素を拾ってみる?
ぜひやりたいです。
今こちらで組んだ 4章の骨格があるので、(略)
(略)
あとは、セクション4だけど、さっきの内容だと、まだ尻切れ感がある。結論セクションを追加するのかな?
(略)
(略)
(略)
(略)
(略)
(略)
(略)
(略)
いまやった主な調整はこんな感じです:
(略)
いま入れた修正はこんな方針です:
(略)
(略)
(略)
(略)
(略)
(略)
(略)
これで完成。これをClaudeで日本語訳させたのが以下である。
(略)
その後、デジタル・オムニバス提案が公表され、noybはこれを批判する長大なレポートを公開した。公の議論は、おなじみの対立構図として描かれている。一方には、個人データの定義を狭め、AIや研究のための新たな例外を設けることでGDPRを「骨抜きにしている」と非難される欧州委員会。他方には、「個人データ」の最大限のスコープと、データ最小化の強いバージョンを擁護する市民社会のアクターたち。
本稿で私が主張したいのは、これが間違った対立軸だということである。両陣営とも、法の射程をどこまで広げるべきかをめぐって争っているが、法が本来何をコントロールするために設計されたのかという点はほとんど無視されている。オムニバスをめぐる議論は、定義をめぐる戦争として扱われているが、本来はデータ保護の原点──個人に関する決定の公正さ、そして無関係なデータに基づく決定の防止──を取り戻す機会として扱われるべきなのだ。
この主張を展開するために、まずオムニバス批判を支配している「最大スコープ」パラダイムについて述べる。次に研究とAIに関する規定に目を向け、なぜ欧州委員会もnoybもリスクの所在を見誤っているのかを説明する。最後に、スコープについての別の見方──「個人データの処理」を指令時代の機能に即して読み直すアプローチ──を提案したい。
デジタル・オムニバス提案に対する現在の批判の中心的な標的は、GDPR 4条1項、すなわち「個人データ」の定義の改正案である。noybの読み方によれば、新しい条文は識別可能性に強く管理者相対的な要素を導入するものだという。すなわち、ある情報がpersonal dataであるかどうかは、当該管理者の視点、リソース、あるいは合理的な努力に依存することになる。再識別のための鍵を持たない主体が保有する仮名化データは、たとえ別の主体が同じレコードを識別できるとしても、その主体にとっては定義の外に落ちる可能性がある。
noybにとって、これは単なる起草上の不備ではなく、憲法上の問題である。その論理は概ね次のようなものだ。
この見方によれば、データ保護指令におけるpersonal dataの定義は、EU司法裁判所の画期的判決を通じて解釈されてきたとおり、EU基本権憲章8条によって事実上「憲法化」されている。そして「憲法化」されたものは、その定義の広さとして理解される。「識別された又は識別可能な自然人に関するあらゆる情報」をより寛大に解釈すればするほど、8条の保護はより堅固になるはずだ、と。
この観点からすれば、唯一の安全な戦略は、何らかの事象の連鎖によって個人と結びつきうるほぼすべての情報をpersonal dataとして扱うべきだと主張し、その情報を含むほぼすべての操作をprocessingとして扱うべきだと主張することになる。オムニバス提案は、客観的で包括的であるべき定義に、管理者相対的な「主観性」を持ち込もうとする試みとして描かれる。それは法的安定性を損ない、執行を分断し、底辺への競争を招くものだ、と。
私はこのような考え方を最大スコープ・パラダイムと呼ぶことにする。基本権を保護する主要な方法は、personal dataとprocessingの概念的到達範囲を可能な限り押し広げ、その最大線をいかなる後退からも守ることだという信念である。このパラダイムには様々なアクターが様々な形で位置している──noybのようなNGO、一部の当局、そして学界の一部──しかし彼らが共有しているのは、「個人データの処理として法的に該当する状況が増える」ことがほぼ自動的に「より効果的な保護」を意味するという想定である。
しかし歴史的に見れば、欧州のデータ保護法制の規範的焦点は「データそのもの」に向けられたことはなかった。それは意思決定システムにおけるデータの利用に向けられていた。信用スコアリング、雇用審査、社会保障の裁定、警察活動、リスク評価などである。初期のデータ保護法、およびその国際的な先行規範は、個人に関する自動化された、あるいはコンピュータ支援による決定が、不透明な方法で、不完全、無関係、あるいは偏った情報に基づいて、強力で中央集権的なファイルにまとめられた形で行われうることへの懸念を動機としていた。
この方向性は、現在の議論ではしばしば見過ごされている二つの特徴に見て取れる。
第一に、processingの概念は、本来、いわば情報パイプラインと結びついていた。データが収集され、保存され、結合され、分析され、決定や行為を支援するために使用される、という一連の体系的な操作のことである。一連の手続的・実体的制約を正当化したのは、このパイプライン──そしてそれにさらされる個人に対してパイプラインが生み出すリスク──であった。定義に「収集」「利用」「開示」「消去」が含まれていたのは、このパイプラインの各段階を捉えるためであり、ある人物の名前への孤立した言及をすべて完全な法的意味でのprocessingに変換するためではなかった。
第二に、よく引用される「十分であり、関連性があり、過度でない」という三要素は、意思決定のためのデータ品質原則として構成されていた。その機能は、個人に影響を及ぼす決定が、決定目的と合理的な関連を持つ情報に基づいて行われ、その目的にとって十分に完全かつ正確であり、無関係な詳細や偏見を含まないことを保証することであった。その趣旨は、データを抽象的に最小化することではなく、決定の情報的基盤を制約して、決定が公正で、恣意的でなく、差別的でないようにすることだった。
この決定志向の視点を念頭に置けば、スコープと保護の関係は違って見える。重要なのは、主として「個人データ」というラベルの下にどれだけ多くの情報が入るかではなく、どの情報パイプラインとどの決定文脈がデータ保護法の射程内に入るかである。一回限りのジャーナリスティックな言及から複雑な自動プロファイリングシステムまで、あらゆるものを無差別にカバーするprocessingの概念は、レトリックとしては拡張的かもしれないが、そもそも特別な法的レジームを必要とした構造的特徴──中央集権化、自動化、反復的使用──をまさに覆い隠してしまうリスクがある。
この観点から見ると、最大スコープ・パラダイムは二つの点で問題がある。
それは過剰に広い。「個人データの処理」という概念的・教義的な装置一式を、データ保護法の特徴的なリスクがごくわずかしか存在しない文脈にまで拡張してしまう。個人へのあらゆる孤立した言及、あらゆる何気ない写真、あらゆる一時的なログエントリをGDPR上の「processing」として扱うことは、「…に関するあらゆる情報」という文言の字義通りの解釈として論理的には可能かもしれないが、それは概念を、本来対処すべきリスク・プロファイルをはるかに超えて拡張してしまう。そうすることで、日常生活における広範な遵守不能か、例外と適用除外の増殖を招き、後者は法をより複雑で理解しにくいものにする。
同時に、それは最も保護が切実に必要とされる場面では保護が不十分である。personal dataの概念的外縁を守ることにエネルギーを集中させることで、真に重要な処理操作──大規模プロファイリング、スコアリング、決定支援システム──の内部構造から注意をそらしてしまう。ここで決定的な問いは、ある情報の断片が抽象的に個人と「関連する」と言えるかどうかではなく、処理のパイプライン全体が、個人に関する決定が十分かつ関連性のあるデータに基づいて行われ、有意義な異議申立ての対象となり、一定の種類の推論に対する明確な禁止によって制約されるような形で構造化されているかどうかである。
言い換えれば、「個人データ」概念の際限のない拡張への固執は、より困難な作業──高度な保護を必要とする決定文脈を特定し規制すること──の代替物として機能するリスクがある。それは、データ保護の基本権が実際にどのような種類の処理を標的としているのか、そしてなぜなのかについてあまり語らなくても、4条1項における管理者相対的な識別可能性のようなスコープの縮小と見えるものを非難することを政治的に容易にしてしまう。
この袋小路から抜け出すためには、データ保護法が常に二つの層で同時に機能してきたことを思い出す必要がある。
本稿の残りでは、この二層構造を詳しく解きほぐし、それがオムニバスをめぐる科学研究、AI、およびpersonal dataの定義についての議論をどのように再構成するのに役立つかを示す。
オムニバス論争の第二の焦点は、4条38項で提案されている「科学研究」の新しい定義と、それに伴う目的制限と情報義務の変更、特に13条5項である。欧州委員会の草案は、科学研究を本質的に「イノベーションをも支援しうるあらゆる研究」と定義し、社会の「知識と福祉」の成長、「当該研究分野における倫理基準」の遵守、および類似の要素を参照する長いリストの基準を付け加えている。
noybのレポートは、このアプローチに対して鋭く、多くの点で正当な批判を展開している。それは次のように指摘する。p>
この分析に基づき、noybは、提案された定義は、研究適用除外の拡大された枠組みと組み合わさって、「広範かつ不明確に定義された『研究目的』のためのさらなる処理を一律に許容する」ことになり、憲章の必要性と比例性の要件を満たさない可能性が高いと主張する。この読み方によれば、欧州委員会は無定形の「イノベーション」アジェンダの祭壇に7条と8条の権利を犠牲として捧げているように見える。
一見すると、この批判は権利保護的な立場と完全に一致しているように見える。しかしその内部ロジックは、やはり二つのおなじみの前提に依拠している。第一に、データ保護の核心は、7条・8条および52条1項の直接的な発現としてのデータ最小化であるという前提。第二に、過度に広い研究定義がもたらす主要な脅威は、このデータ最小化と目的制限そのものの浸食であるという前提。どの種類の研究が、そしてどの決定文脈が、より厳格な審査の対象とされるべきかという問いは、ほとんど暗黙のままである。
決定志向の視点──意思決定における十分性と関連性の役割を真剣に受け止める視点──は、この問題を切り分ける別の方法を示唆する。
一方には、識別可能な個人に関する具体的な決定に直接供されない形態の研究がある。古典的な統計的・科学的データ利用、すなわち産出物が集団を記述する集計的パターン、係数、モデルであるような利用は、倫理、分配的正義、認識論的バイアスの重要な問題を提起しうる。しかしデータ保護の観点からは、そのリスク・プロファイルは主として研究の後に何が起こるかによって媒介される。すなわち、得られた知見が運用上の決定システムにどのように、どの程度組み込まれるかである。
他方には、処遇決定に構造的に接続されている形態の研究がある。顧客データベースで開発される信用リスクモデル、過去の応募者で訓練される採用アルゴリズム、保険価格モデル、不正検知ツールなどである。ここでは、「研究」と「運用」の境界は薄い。モデルを開発するために使用されるのと同じ構造化されたデータセットが、個人に関する重大な決定を支援するために使用される、あるいは容易に使用可能である。
この第二の類型において、データ保護にとって重要なのは、抽象的な「研究」が厳密に必要な以上のデータを使用することではなく、結果として生じる決定システムが決定目的と関連しないデータに基づいて運用されうることである。核心的なリスクは恣意的または差別的な処遇である。音楽の趣味が与信限度額に影響を与える、ソーシャルメディア活動が採用に影響する、近隣の代理変数が保険価格において民族性の代わりに使われる。これらはまさに、十分性と関連性の要件が本来防止するはずだった種類の問題である。
この観点からすれば、オムニバス提案の4条38項および13条5項の変更は問題があるが、それは主としてデータ最小化という抽象的な理想を侵害するからではない。それらが問題なのは、以下の理由による。
noybの批判は、定義の曖昧さと「イノベーション」がさらなる処理の白紙委任として使われるリスクを正しく攻撃している。しかし、問題を主として憲章に適合するデータ最小化の観点から捉えることで、決定的な問いを発する機会を逃している。どの研究生成データセットが決定文脈に流入する可能性が高く、無関係または差別的な意思決定を防ぐためにその再利用はどのように制約されるべきか? これは、以前のオムニバス論争に関する投稿で私が展開した視点であり、そこで私は欧州委員会もnoybも5条1項(c)のGDPRの明示的な関連性要件を見落としがちだと主張した。
同じパターンが、AIと特別カテゴリーのデータを扱う9条2項(k)および5項に関するオムニバス提案において、より鮮明な形で繰り返されている。草案は「AIシステム…またはAIモデルの開発および運用の文脈における処理」のための新たな適用除外を導入し、5項では管理者に対し、訓練、テスト、検証において特別カテゴリーの処理を避けるための「適切な組織的・技術的措置」を講じ、特定された場合はそのようなデータを削除するか、削除に不均衡な努力を要する場合は少なくとも出力への影響や開示を防止することを求めている。提案された前文33は、これを「AIの開発と運用を不均衡に妨げないために」9条1項の禁止からの適用除外として明示的に位置づけている。
noybはこの構造をおなじみの論拠で批判している。AIはまさにデータ保護原則が本来制約するために設計された、不透明で大規模な処理の一種であり、AI開発・運用のための新たな適用除外を設けることは後ろ向きであり、そのようなシステムを念頭に置いて書かれたまさにその保障を骨抜きにする恐れがある、と。また、緩い起草(「の文脈における」「適切な措置」「不均衡な努力」)と、何らかの最小化努力を講じたと主張できる限りAI開発者が特別カテゴリーを保持することを一般的に許可することになるリスクも指摘している。
ここでも、この批判路線は理解できるが、それは「AI開発」が単一の活動であり、関連する憲章上のリスクは処理されるデータの量と機微性によって捕捉できるという前提に立っている。実際の状況はより複雑である。
以前のブログ投稿で私が主張したように、「AI開発」というラベルは現在、根本的に異なる二つの活動をカバーしている。
処遇AI、例えば信用スコアリング、採用、保険モデルは、真正な体系的データセット──データ保護法の意味でのプロトタイプ的な「個人データ」である顧客または候補者のデータベース──で訓練される。ここでは、データベース志向の要件が構造的に意味を持つ。訓練セットにおける不必要な特別カテゴリーを最小化し、不適切に含まれている場合は削除し、機微な訓練データを開示や悪用から保護する。
生成AIの公開ウェブテキストに対する訓練は、対照的に、すでに公開されている情報の散在する断片を処理して統計的パターンを抽出する。それは体系的な個人レコードを作成しない。結果として生じるモデルは、通常の運用において、特定の人物の機微な特性についてアドレス可能なレコードを含まない。主要なリスクは、識別された個人についての特別カテゴリーの開示ではなく、生成されたコンテンツにおけるバイアスやステレオタイプの増幅にある。
第二の類型について、9条5項の要件は単に的外れである。管理者に対し、異質なウェブページのコーパスから特別カテゴリーを「削除」するよう指示することは、存在しないデータベース的構造を前提としている。正確には何を削除すべきなのか──文、段落、文書全体か?「可能な場合」という修飾語は、首尾一貫した基準を提供することなく実行不可能性を認めている。特別カテゴリーの「開示」を防止するという文言は、開示が管理されたデータベースから特定の個人の機微データを明らかにすることを意味する文脈を前提としており、健康や宗教が抽象的に言及される新しいテキストを生成することではない。
これらの構造的に異なる活動を単一の適用除外の下にまとめることで、オムニバス提案はpersonal dataの定義においてすでに見られた概念的混同を繰り返している。同時に、決定志向の観点からより重要なことに、それは規制上の注意を誤った場所に向けている。
散在する公開テキストに対する生成AIの訓練は、個人に関する決定に適した体系的データセットを構築することがないため、規範的にはpersonal dataの処理として扱われるべきではないにもかかわらず、実行不可能なデータベース志向の要件の直接の標的となる。
処遇AIの運用──構造化されたデータセットを使用して個人に関する重大な決定を行う場面──は、比較的少ない的を絞った注目しか受けない。88c条はAI運用を正当な利益として認めているが、この文脈で5条1項(c)の関連性要件を執行する仕組みを提供していない。したがって、音楽の好み、ソーシャルメディア活動、宗教的所属といった無関係な特性が、「正当な利益」の旗印の下で決定に織り込まれうることになり、個人の異議申立権のみが制約となる。
要するに、オムニバス提案もその批判の多く(noybを含む)も、AIシステムがどれだけの、どのような種類のデータを処理しうるかに焦点を当て、AI支援決定に使用されるデータが決定目的と関連しているかどうか、そして恣意的または差別的な結果を生む形でのデータの文脈横断的再利用をどのように防ぐかという問いは、ほとんど手つかずのまま残している。これがまさに、5条1項(c)の関連性に基づく解釈が埋めるべきギャップなのである。
この時点で明白な問いが浮かぶ。欧州委員会もnoybも問題を間違った形で捉えているなら、研究とAIのより良い扱いは実際にはどのようなものになるのか? 新しい研究定義と9条2項(k)のAI適用除外──そしてpersonal dataを再定義しようとする試み──の両方に共通する政治的な動因の一つは、現在の「個人データの処理」の解釈の下では、ウェブスケールのAI訓練やその他の大規模分析さえもGDPRの完全なレジームに自動的に吸い込まれてしまうという恐れであることは明らかだろう。
私の答えは、リークされたオムニバス草案に関する以前の投稿と本質的に同じだが、新しい定義とAI提案にまで拡張される。
学習フェーズには既存の統計・研究の枠組みを維持する
欧州にはすでに、個人に関する決定にそれ自体が供されない大規模分析を扱う首尾一貫した方法がある。それは以下の組み合わせである。
GDPR 5条1項(b)における統計・科学目的のための「両立性」ルール
欧州評議会の統計処理に関する古い枠組み。これは、統計結果に基づいて個人に関する決定や措置が取られない限り、個人の権利の制限を認めている。
AI訓練はここに属する。大規模データセットでモデルを訓練することは、実質的に統計処理である。この段階では、定義上、まだ具体的な決定目的がないので、モデルやその入力のレベルで関連性テストを適用することにはあまり意味がない。十分性と関連性の要件は、決定の情報的基盤に対する制約であり、抽象的なモデルの構造に対する制約ではない。保護される核心的利益は、学習アルゴリズムが特定の変数を「見た」というだけで侵害されるのではない。それは、それらの変数が実際に個人に関する決定パイプラインの一部として使用されるときに侵害される。
この区別は決定的に重要である。モデルは内部的に、決定時に明示的に使用されれば無関係となる特徴を含む多くの特徴に影響されたパラメータを含んでいるかもしれない。データ保護にとって重要なのは、ある人物について決定する際に実際にどのデータが考慮されるか──運用システムにおいてどの変数が読み取られ、結合され、行動の基礎とされるか──である。したがって、法的アーキテクチャは非常にシンプルであるべきだ。
学習・訓練=統計または研究処理。そのような目的のための既存ルールでカバーされ、産出物が直接に個人について決定するために使用されないことを厳格な条件とする
運用=意思決定。完全なデータ品質審査の対象となり、決定に実際に使用される入力に関して5条1項(c)の「十分であり、関連性があり、過度でない」の真摯な執行を含む
特別なAI適用除外は不要であり、広範なものは有害である
AI訓練を統計処理として、AI運用を通常の(しかし極めて重大な)意思決定として扱うなら、9条2項(k)その他における新たなAI固有の適用除外は必要ない。むしろ、「AI開発・運用のための」一律適用除外は、以前の投稿で私が批判したまさにそのことを招くリスクがある。管理者が「AI」をマジックワードとして援用し、両フェーズを同時に正当化することを可能にし、運用フェーズにおけるシンプルな問い──このAI支援決定に実際に使用するデータは、決定目的と関連しているか?──を問うことがなくなる。
特別カテゴリーもAI専用レジームを必要としない
学習フェーズについて、正しい問いは「ウェブスケールの訓練コーパスから特別カテゴリーのあらゆる痕跡をどのように除去できるか?」ではなく、「統計目的で使用される訓練コーパスが、特別カテゴリー──直接的であれ推論されたものであれ──が決定目的と無関係となる決定システムにカジュアルに転用されないようにするにはどうすればよいか?」である。
運用フェーズについて、関連性が適切に執行されれば、直接明らかにされた機微データと推論された機微データの区別はさほど重要ではなくなる。両方とも、決定目的に照らして「あなたには無関係」である場合には排除される。以前の投稿で私が主張したように、問題は、我々が決定層における関連性についての執行力をまず構築することなく、9条をスリム化しようとしていることである。
言い換えれば、AI固有の例外や研究固有のショートカットを発明する代わりに、AI訓練を本来の場所──既存の統計・研究の枠組み──に戻し、規制上のエネルギーを、関連性要件が決定がなされる時点でついに真剣に受け止められなければならないAI運用に集中させるべきなのである。
ここまでの議論は、データ保護が相互に連関する二つの層で機能していることをすでに示唆している。
この構造をより明確にし、オムニバス提案が各層にどのように影響するかを問うことができる。
機能的な観点から見ると、EUのデータ保護法は二つの別個だが相互依存的な層で機能している。
第一に、決定の直接的ガバナンスがある。個人データが実際に個人に関する決定を行う、または支援するために使用される場合、データ保護法は、それらの決定の情報的基盤が伝統的なデータ品質基準を満たすことを要求する。データは決定の目的にとって十分であり関連性があり、過度であってはならない。現代の言葉で言えば、使用されるデータ項目と正当な決定目的との間に合理的な関連がなければならない。古典的な「十分であり、関連性があり、過度でない」という定式が属するのはここである。それは決定がどのように行われるかに対する制約であり、データを抽象的に最小化せよという呼びかけではない。
第二に、データ流通の予防的ガバナンスがある。目的制限、再利用と転送の制限、「データサイロ」の構築は、過ぎ去ったデータベース規制時代の不可解な遺物ではない。それらは十分性と関連性の将来の違反を防止するために設計された事前のツールである。経験的な直観はシンプルである。
データがいったん新しい文脈に流入し始めると、それが関連性のない決定に再利用される確率は急激に上昇する。
ある明確に定義された目的のために収集されたデータセットが、構造的制約なしに転用、結合、取引されうるなら、ある主体がそれを、データと合理的な関連のない決定への入力として使用するのは時間の問題である──音楽の趣味に基づく信用スコアリング、ソーシャルメディア活動に基づく保険価格設定、政治的所属に基づく採用決定など。
このように見れば、目的制限は公正さについての装飾的な前文ではない。それは、どのデータが現実的にどの決定システムに供されうるかというデータ流通の将来のグラフを法が形成しようとする中心的な法的メカニズムである。決定層は決定の内容(十分性と関連性)を規律し、流通層はデータがそもそも決定文脈にたどり着きうる経路を規律する。
したがって、「個人データ」の境界を引き直そうとする試みは二つの効果を持つ。
オムニバス提案のpersonal dataの定義に関するリスクは、この第二のレベルで最もよく理解される。
オムニバス提案は、personal dataの地位が特定の管理者の手段に依存しうるという考えを発明したのではない。それは裁判所の相対的アプローチ、特により最近の判例法で表明されたものを法典化している。核心的な考えは、情報がある管理者にとってpersonal dataとしてカウントされるのは、その管理者が当該個人を識別するために「合理的に使用される可能性がある」手段を持っている場合に限られるというものである。再識別のための鍵を持たない主体が保有する仮名化データセットは、たとえ別の主体が同じレコードを識別できるとしても、その主体にとっては定義の外に落ちる可能性がある。
表面上、この措置は現実の問題に対する技術的解決策として提示されている。すなわち、識別可能性を何らかの形で相対化しなければ、誰かが人物と結びつけうるあらゆるデータがすべての者にとってpersonal dataとして扱われるリスクがある、という問題である。しかし二層構造を見れば、異なる像が浮かび上がる。
単純化した仮想事例を考えよう。ある会社が、顧客がジャズ、ロック、クラシックのどれを好むかという音楽の好みに関する情報を、安定した内部識別子に紐づけて収集している。収集時点で、データを仮名化し、純粋に市場調査のためにのみ使用すると宣言する。相対的な定義の下では、会社は次のように主張しうる。
もしこの立場が認められれば、決定的な帰結が生じる。目的制限がデータセットに一切付着しない。データは構造化された形式で収集・処理されているが、その管理者にとって「非個人」として扱われる限り、データ保護の流通ガバナンス層全体が単純に適用されない。
数年後に早送りしよう。会社は戦略を変更し、信用スコアリング市場に参入する。そのデータセットにおいて、音楽の好みが返済履歴と相関することを発見する。今や会社には、以下の強いインセンティブがある。
その時点で、会社は今は識別手段を持っており、データは今はpersonal dataを構成すると主張するだろう。しかし目的制限は遅すぎる形で援用される。データが当初「非個人」として分類されていたため、その収集と保持を特定の限定された目的のセットに結びつける法的義務も、後の信用スコアリングへの再利用を、新たな法的根拠と当該個人への新たな保証を必要とする目的変更として扱う義務もなかった。
これは奇抜なエッジケースではない。それは「識別手段がないとの主張を通じた目的漂流」という体系的パターンを記述している。
同じロジックは、孤立した会社だけでなく、主体の連鎖全体にも適用される。上流の主体が、再識別の鍵を持っていないことを根拠に、豊かで個人レベルの構造化されたデータセットを「非個人」として扱えるなら、それらのデータセットは、識別された人物と結びつけ、決定システムに組み込む手段とインセンティブを持つ主体に到達するまで、自由に流通しうる。目的制限はまさにそのような文脈横断的流通を制約するはずだった。相対的な定義は、普及の最も重要な段階においてその射程から外れることを容易にする。
欧州委員会に対し、実施法を通じて仮名化データセットの特定のカテゴリーを「非個人」として指定する権限を与えるオムニバス提案は、このリスクを悪化させるだろう。そのような指定がなされれば、構造化されたデータのクラス全体が、後に決定パイプラインに再統合されるのに完全に適している間も、単なる技術的な排気ガスであるかのように移動しうる。消失するのは、何か周辺的な透明性義務だけではない。流通の各段階において「これらのデータをこの次の文脈に移動させることを正当化する目的は何か?」と問う事前の要件が消失するのである。
決定と流通志向の観点からすれば、オムニバスの再定義の危険は、主としてGDPRを抽象的な意味で「広くなくする」ことではない。それは、構造化され、決定に使用可能なデータセットを、予防的な流通ガバナンス層がその最も重要な仕事をするまさにその段階において、その層から除外することである。
同時に、GDPRはその適用対象範囲条項の形で、すでにゲートを持っていることを思い出す価値がある。2条は、規則を「個人データの処理」に限定している。「GDPRは何にでも適用される」という広く聞かれる不満は、そのようなゲートが存在しないからではなく、processingが次第に「ある人物に関するあらゆる情報のあらゆる取扱い」へと平坦化されてきた──政治的想像力においては、AI訓練のためのウェブクローリングやその他の大規模分析を含めて──からである。オムニバス提案はこの過広認識を額面通りに受け取り、personal dataの定義そのもののレベルでそれを治療しようとしている。最大スコープ・パラダイムは逆方向から反応し、personal dataとprocessingの可能な限り広い解釈を擁護している。両方の動きに共通しているのは、processingの構造的概念を手つかずのまま放置していることである──そしてそれとともに、GDPRの適用対象範囲は体系的でファイル的な処理パイプラインを捉えるためのものであり、個人への散在するあらゆる言及を捉えるためのものではなかったという、本来の考えも放置している。
この背景に照らして、保護の両方の層を真剣に受け止めるなら、スコープの問いを構成する別の方法が示唆される。personal dataとprocessingの概念をどこまで概念的に拡張できるかを問う代わりに、どの状況においてEUのデータ保護法が、最低限、両方の層にわたって完全な力で適用されなければならないかを問うべきである。
決定と流通志向のテストは、予告的に、次のように定式化できよう。
体系的なパイプライン
processingの本来の意味での体系的な情報パイプラインが存在しなければならない。安定したカテゴリーやフォーマットに従って組織化されたデータに対する、構造化された一連の操作であり、単なる孤立した言及やアドホックなやり取りではない。これが、「データ」を散在する「情報」から区別し、初期のデータ保護法制が規制しようとしたものを捉える閾値である。
決定文脈
このパイプラインの産出物が、個人の法的・社会的地位に影響を与える決定文脈──信用、雇用、保険、社会給付、サービスへのアクセス、法執行、およびそれに類する領域──で使用される、または合理的に使用される可能性がある。ここで決定層が作動し、5条1項(c)は、処理される各データカテゴリーと表明された決定目的との間に合理的な関連を要求する、真正な関連性要件として解釈・執行されなければならない。
文脈横断的流通リスク
パイプライン内のデータが、目的制限と転送制限が適用されない限り、それらが関連性を持たない別の決定文脈に現実的に流入しうる。このような文脈横断的な漂流が構造的にあり得る場合──大規模分析、AI開発、プラットフォームエコシステムにおけるように──流通層は、管理者が現時点で識別手段を持っていると主張するかどうかにかかわらず、データが構造化された形式で収集された瞬間から適用されるべきである。
この見方によれば、オムニバスのpersonal data再定義の問題は、最大スコープという抽象的な理想を放棄することではない。問題は、それが管理者がこの三部構成のテストから任意に離脱することを許容する点にある。収集時点で識別手段を持たないと宣言するだけで──たとえ後に重大な決定システムに投入されうるような構造化されたデータセットをまさに構築している最中であっても──テストから外れることができてしまう。そのようなデータセットがpersonal dataという法的カテゴリーの外側で生まれてしまえば、その将来の流通を事前に形成する法の能力は損なわれる。
同じテストは、概念的に、AI関連処理の異なる類型を区別するのにも役立つ。散在する公開テキストコーパスに対する生成AIの訓練は、第一と第三の要件を満たさないかもしれない。それは体系的で個人宛(individual-addressable)のデータセットを作成せず、その産出物は自然に決定文脈に接続されない。対照的に、処遇AI──信用スコアリング、採用アルゴリズム、保険価格モデル──は三つの要件すべてに該当する。構造化されたレコードを操作し、個人に関する決定を直接支援し、そのデータセットには明らかな文脈横断的再利用可能性がある。
この解釈的提案は、GDPR 4条1項の条文を書き換えることを求めるものではない。既存のprocessing of personal dataおよびpersonal dataという概念を、その指令時代の機能に照らして読み直すことを求めるものである。
歴史的に、processingの構造的理解は、時代遅れの「ファイル」概念の偶然の副産物ではなかった。欧州委員会の1990年提案はなおファイルの言葉で語っていたが、欧州議会が「ファイル」を「個人データの処理」に置き換えることを主張したとき、それは構造的要件を完全に放棄することを意味していなかった。それは、文字通りの中央集権的ファイルなしに同じリスクを再現するオンザフライの決定システムを含め、ファイル的な処理パイプラインを捉えることを意図していた。「ファイル」から「個人データの処理」への移行は、概念を機能的な線に沿って拡張したのであり、「あらゆる情報のあらゆる取扱い」へと溶解させたのではなかった。
一部の判決──特に境界事例において──は、processingを「あらゆる情報のあらゆる取扱い」という一般則に変換することなく、特定の事実関係のために概念を拡張したものとして読むことができる。真の緊張が残る場合、それは、基礎にある概念がなお慎重な教義的明確化を必要としているまさにその時に、オムニバスが最大主義的スコープを憲法化するのは時期尚早であることを示唆している。
デジタル・オムニバスをめぐる公開書簡やプレスリリースだけを読めば、おなじみのドラマに見える。一方には、個人データの定義を狭め、AIや研究のための新たな適用除外を設けることでGDPRを「骨抜きにしている」と非難される欧州委員会。他方には、個人データの最大スコープとデータ最小化の強いバージョンを擁護するnoybその他のアクター。
本稿で私が以前の分析を踏まえて主張してきたのは、これが間違った対立軸だということである。両陣営とも、法の射程をどこまで広げるべきかをめぐって争っているが、法が本来何をコントロールするために設計されたのかという点はほとんど無視している。1970年代以降、欧州のデータ保護法は抽象的な「データ」を対象としていたわけではない。それは意思決定システムを対象としていた。構造化されたデータが収集され、組織化され、雇用、信用、保険、社会給付その他の利益と負担を配分するために使用されるパイプラインである。
この観点から見れば、GDPRの核心は「データが多すぎる」ことへの抽象的な恐怖ではなく、一対の関連する問いである。個人に関する決定においてどのデータが正当に考慮されてよいのか、そしてデータが目的と合理的な関連を持たない決定文脈に流入することをどのように防ぐべきか? これこそが、データ品質原則と目的制限が本来対処するために構築されたものである。
ここで、二つの自然な疑問が浮かぶかもしれない。
第一に、これは結局、名前を変えたデータ最小化ではないのか、という疑問である。結局のところ、GDPR 5条1項(c)は今や文字通り、データは処理目的との関係で「十分であり、関連性があり、必要なものに限定される」べきだと述べており、データ保護指令もすでに「十分であり、関連性があり、過度でない」と述べていた。法は常にデータを最小化することを目指してきたのではないか?
私の答えは、歴史的に見れば、この三要素は決定のためのデータ品質原則として構成されていたのであり、「できるだけ少ないデータを収集せよ」という宙に浮いた命令ではなかった、というものである。「過度でない」──そして後に「必要なものに限定される」と言い換えられたもの──は、所与の決定目的にとっての十分性と関連性をも要求する基準の中に埋め込まれていた。監督当局のガイダンスはしばしば「十分」を「表明された目的を適切に果たすのに足りている」と解説している。しかし「足りている」は時として、より少ないデータではなく、より多くのデータを意味する。恣意的な信用拒否を避けるためのより完全な収入情報、単一のデータポイントの誤解を避けるためのより多くの文脈、粗雑なプロファイリングを防ぐためのより多くのニュアンス。「より少ないデータ」を基本権の観点から常により良いと扱う純粋な最小化の読み方は、この両義性を消し去り、十分性と関連性を一次元的な「量」の指標に押しつぶしてしまう。この観点からすれば、5条1項(c)をデータ最小化原則とリブランドすること自体が問題の一部なのである。それは決定にとっての関連性と十分性という本来の焦点を覆い隠し、より良い保護が実際にはより薄いデータではなくより良いデータを必要とする状況を見落としやすくする。
第二の、密接に関連する疑問は、これは結局、自動化された意思決定に関するGDPR 22条の強化を求めることに帰着するのではないか、というものである。22条をめぐる最近の戦いは、ある意味で、同じ誤った枠組みの症状である。データ品質原則がpersonal dataを考慮に入れるすべての決定の情報的基盤をすでに規律していることを忘れているがゆえに、プロファイリングやAIに関するあらゆる懸念を、22条の「専ら自動化された」決定という狭いカテゴリーに背負わせる傾向がある。そこで一方の陣営は、実際には5条1項(c)の一般的レジームに属する問題を治癒してくれることを期待して、22条をますます広げることを要求する。もう一方の陣営は、22条は十分性と関連性を尊重した適切なプロファイリングさえも烙印を押す行き過ぎだと結論づけ、それを骨抜きにするか廃止することを推進する──この雰囲気はオムニバス論争においても皆無ではない。
両陣営が忘れがちなのは、22条は非常に小さなサブセットのケースのための特別法(lex specialis)だということである。私がここで再構成しようとしてきた基本的な基準は、より一般的でより基本的なものである。それは、自動化と人間の関与の組み合わせがどうであれ、personal dataが意思決定に使用されるすべての場合に適用される。その基準が主として根拠を置くのは5条1項(c)および周辺のデータ品質・目的制限規定であり、22条ではない。22条を強化することは、関連性要件を全面的に真剣に受け止めることの代替にはなりえない。22条を弱体化しても、決定層における十分性と関連性を無視し続け、無関係なデータが重大な決定に密かに浸透できるように流通ガバナンスを緩和するなら、決定システムが無害になるわけではない。
この背景に照らせば、デジタル・オムニバスの真の約束と危険がより明確になる。約束とは、現在の論争が基本的な問いを再び開かせる契機となりえたはずだということである。構造的な意味で「個人データの処理」として何がカウントされるのか? データ保護の特徴的なリスクは実際にはどこで生じるのか? 統計・学習フェーズと運用上の意思決定をどのように区別すべきか? 危険とは、processingの基礎概念がなお慎重な教義的作業を必要としているまさにその時に、最大主義的なスコープ解釈を憲法化してしまうこと──そして同時に、最も緊急に厳格な流通ガバナンスを必要とするまさにその構造化されたデータセットのために、密かにバックドアを開けてしまうことである。
本稿で素描した代替案は、条文上の野心は控えめだが、効果においてはラディカルである。それは4条1項を書き換えることを求めていない。「個人データの処理」と5条1項(c)を、その指令時代の機能に即して読み直すことを求めている。AI訓練は既存のルールの下で統計処理として扱われるべきであり、真の規制上のエネルギーは、十分性と関連性の要件がついに効力を発揮しなければならないAI運用やその他の決定システムに向けられるべきだと提案している。そして、欧州委員会もその批判者たちも、personal dataという法的概念をどこまで引き伸ばせるかから、データが決定に流入するパイプラインを法がどのように規律するかへと注意を移した方がよいと提案している。結局のところ、それこそがデータ保護の存在理由だったのだから。
*1 例えば、ドイツが歴史的にデータ品質原則を一度も理解した様子がないことを裏付けるには、1973年のSpiros Simitisの初期の構想「Datenschutz - Notwendigkeit und Voraussetzungen einer gesetzlichen Regelung」(DVR 2巻138頁以下)で「Relevanz」概念がどう書かれていたか、1977年のOtto Mallmannが「Zielfunktionen des Datenschutzes: Schutz der Privatsphäre, korrekte Information; mit einer Studie zum Datenschutz im Bereich von Kreditinformationssystemen」で、信用情報システム分野を題材に、被影響者の差別のリスクに言及しながら「正確性」「完全性」に並び「文脈依存性の維持」を挙げて問題の本質に迫っていたにもかかわらず、その出口を必要性(Erforderlichkeit)に求めてしまったこと、その後もSimitisは一貫して何らかの具体的基準の必要性を訴え続けるものの、その答えは示されず、2000年ごろから出口が見えないままDatensparsamkeitに傾倒して行き、ついにはHans Peter Bullに、データ禁欲(Datenaskese)とか正気か?と窘められるという展開があったこと、Bull自身は、データ保護の趣旨を正しく理解し、より多くのデータ項目を要することもある旨を指摘していた(しかしDPDのデータ品質原則がそれをカバーしていることには触れていない)こと、ドイツでも労働法分野では古くから関連性(sachlicher Zusammenhang)を要件とする判例と学説が確立していたが、データ保護法制のデータ品質原則がそれをカバーしているとは気づいていない様子がある(Peter GolaのBDSGコンメンタールなど)こと、国内法のBDSGは長らくDPDのデータ品質原則を無視して(比例原則と勘違いして)導入しなかった(対応済みだと勘違いして)こと、それが原因でSCHUFAの住所を用いたGeoscoringに対処できず、BDSG 2010で個別の規制条項を導入していること、それにもかかわらず問題は解決せず、結局GDPR 22条に活路を見出そうとして現在も迷走していること、Alexander Roßnagelが、1990年代から2010年代にかけて常にDatensparsamkeitを強調し、GDPRの成立に際しても、Datensparsamkeitが徹底されなかったことを指摘し、22条の自動決定規制をもっと強化すべきとGDPRの改正を主張していたこと、などなどを示す必要があるだろう。情報的自己決定権を持ち出してDatensparsamkeitを強調する者には、国勢調査判決以来の「Informationelle Selbstbestimmung」がドイツの学説でどう論じられてきたか、特に2010年のGabriele Britz「Informationelle Selbstbestimmung zwischen rechtswissenschaftlicher Grundsatzkritik und Beharren des Bundesverfassungsgerichts」(Offene Rechtswissenschaft: ausgewählte Schriften von Wolfgang Hoffmann-Riem mit begleitenden Analysen、561頁以下)がどう結論づけているかなどを挙げるのがいいし、ドイツ以外でのデータ保護法制のrelevant要件の意味が、本当に私の言うような意味のものだったのかについては、Paul SieghartやJon Bingの文献の他、英国Lindopレポートの記述と、米国FCRA 1970立法過程の公聴会の記録を参照するのがよいだろう。
*2 このことは日本にとっても他人事ではない。生成AIの台頭に伴って日本の個人情報保護委員会も一昨年、要配慮個人情報の収集についてOpenAI社に対して無理のある注意喚起を出し、保護の方向性について自民党から疑問視される事態になっていたのは、欧州とよく似た状況である。ちょうどその頃始まっていた日本の個人情報保護法の3年ごと見直しでは、この問題に対処するべく、私の提出意見が通り、生成AIの学習段階を統計処理と捉えて、要配慮個人情報が含まれてしまうことを問題視しないようにする改正が予定(昨日の新聞報道)されている。
Twitterで、12月12日の「AI時代の知的財産権検討会(第10回)」の配布資料「AIの適切な利活用等に向けた知的財産の保護及び透明性に関するプリンシプル型コード(仮称)(案)」が、これはひどいと話題になっているのが流れてきたので、読んでみたところ、色々言いたいことが思い浮かんだ。本来ならば論文で指摘するべき話だが、他に先に書かないといけないことばかりで、いつになったらできるかわからない。今動いている話なので、急ぎここに記す必要があるが、書くのが面倒なので、生成AIに書かせた。自分で書けばぐちぐちと悩みながら2、3日かけるところだが、もはや生成AIのおかげで、気づいてから半日で完成だ。(どういうプロンプトで書かせたかは末尾に開示しておく。)
関係者の皆さんには読んでほしい。方向付けさえすれば自然にここまで言われてしまうという事態の深刻さを受け止めてほしい。
5月に「処遇AIと生成AIの区別ができていない」と指摘した。国会審議で、処遇AI(人事評価の差別)について質問されているのに、大臣が生成AI(差別を助長する出力を防ぐ)のことを答弁してしまう事態が起きていた。AI事業者ガイドラインの「差別」「バイアス」への言及も、精査してみると生成AIの出力についてしか述べられていなかった。
12月には欧州向けに、EUのDigital Omnibus規則案についても同様の混同が起きていると批判した。欧州委員会もnoybも、「GDPRのスコープを広げるか狭めるか」という間違った軸で戦っており、データ保護法の本丸である「決定の適切性」と「関連性の原則」が見失われている、と。
そして今、さらなる混同が発生している。今度は「知財面からのAI規制」においてである。
先週金曜日(12月12日)に開催された「AI時代の知的財産権検討会」第10回会合の資料が公開され、「プリンシプル・コード(仮称)(案)」が示された。これを見た人々からX上で悲鳴が上がっている。
「日本が20年続けてた負けパターンに嵌ってきた感」「クソデカため息しか出ない」「会議内容から失われた日本を絶対に取り戻さない強い意志を感じる」——。
政府は「世界で最もAIを開発・活用しやすい国」を標榜している。その方針自体は正しい。だが、この資料を見る限り、その方針とは真逆の方向に進んでいるように見える。
より具体的な指摘もある。「責任追跡を書類と掲示で担保しようとしている」「全部書けば透明性と思っていそう」「新聞で言えば取材源を全部公開しろと言っているようなもので、副作用を考えていない」「学習データ開示やログ管理が数兆トークン規模で不可能」「EUに合わせた以外の根拠がない」「OpenAIは絶対応じないだろう」——。
さらに、「EU AI Actをほぼ丸パクリしつつ強制力なしのため正直者だけバカを見る」「ゲーム開発者も対象になり得る定義の広さで、国外事業者は無視して国内だけ萎縮する」「NDAや営業秘密のセーフハーバー(免責)が考慮されていない」といった指摘もある。
これらの不満は、感情的な反発ではない。制度設計として当然の帰結を指摘している。問題は「規制が厳しいか緩いか」ではない。規制の目的と手段が噛み合っていないのである。
知財検討会の第10回資料2「プリンシプル・コード(仮称)(案)」を見ると、「透明性確保のための措置」として、学習データ、クローラ、トレーニングプロセス等の開示が列挙されている。ここまでは知財(著作権)の観点から一定の合理性がある。
なお、この文書は自ら「EU AI Actにおける取組」を参照し、「comply-or-explain」方式を採用すると明記している。EUを手本にしていることは、文書自身が認めているところである。
問題はその先である。同じ「透明性」の箱に、「アカウンタビリティ関係」として次の記述がある。
AIシステム・サービスの開発・提供・利用中に行われた意思決定等について、技術的に可能かつ合理的な範囲で追跡・遡求が可能な状態の内容(記録方法、頻度、保存期間 等)
そしてこの根拠として、脚注でAI事業者ガイドラインの「検証可能性の確保」を引用している。そこにはこう書かれている。
AIの判断にかかわる検証可能性を確保するため、データ量又はデータ内容に照らし合理的な範囲で、AIシステム・サービスの開発過程、利用時の入出力等、AIの学習プロセス、推論過程、判断根拠等のログを記録・保存する
ログの記録・保存にあたっては、利用する技術の特性及び用途に照らして、事故の原因究明、再発防止策の検討、損害賠償責任要件の立証上の重要性等を踏まえて、記録方法、頻度、保存期間等について検討する
「AIの判断」「推論過程、判断根拠」——これは何のための規律か。「事故の原因究明」——これはまた別の話ではないか。
ここで改めて、5月から使っている概念を確認し、一つ追加しておく。
処遇AIとは、個人をデータに基づいて他の個人らと異なって扱うことを目的としたAIである。採用判定、与信判断、保険料算定、行政給付の決定、監視対象の選別などがこれに当たる。処遇AIの規律で問題となるのは、決定の適切性である。関連性のないデータで人を分けていないか。誤ったデータで不利益な決定をしていないか。不当な差別が生じていないか。決定に対して異議申立ての途が開かれているか。
生成AIとは、表現(文章、画像、音声など)を生成するAIである。生成AIの規律で問題となるのは、主に出力段階の問題である。ディープフェイク、偽情報、出力が既存著作物に類似する場合の著作権侵害、悪用防止などがこれに当たる。学習段階で問題となるのは、取得手段の違法性(不正アクセス等)程度である。
製品AIとは、物理的な動作や制御を担うAIである。自動運転車、産業用ロボット、医療機器などがこれに当たる。製品AIの規律で問題となるのは、製品安全である。事故が起きたときの原因究明と再発防止がこれに当たる。従来の製品安全法制の延長線上にある。
この三つは、規律の目的が根本的に異なる。
処遇AIで必要な「透明性」は、本人救済と監査のための透明性であり、「この人をこう扱った理由」が争える形で残っていることを意味する。
生成AIで必要な「透明性」は、出力段階での検証と悪用抑止のための透明性であり、「生成物がAI製であること」の表示や、問題ある出力への対応窓口などを意味する。
製品AIで必要な「透明性」は、事故調査のための透明性であり、「何が起きたか」を事後に再現できることを意味する。
三者を混ぜると、規制は必ず変になる。
プリンシプル・コード案の「意思決定等について…追跡・遡求が可能」という文言は、実は二通りに読める。
一つは、「事業者の意思決定」——開発・提供・利用を決めた経緯の記録という読み方である。これなら知財紛争での立証に関係しうる。
もう一つは、「AIの意思決定」——AIが個人に対して行った判断の記録という読み方である。これは処遇AIの規律に属する。
文言だけなら前者の読み方も不可能ではない。だが、脚注で引用されているAI事業者ガイドラインを見れば、話は明らかである。ガイドラインは「AIの判断」「推論過程、判断根拠等のログ」と言っている。これは「事業者がどう決めたか」ではなく、「AIがどう判断したか」の記録を求める語彙である。
さらにガイドラインは、ログの目的として「事故の原因究明」を挙げている。これは製品AI寄りの語彙である。
知財検討会は知財(著作権)の問題を扱う場である。著作権の観点から透明性が問題になるとすれば、取得手段の適法性や、出力が既存著作物に類似する場合の検証などであって、「AIがどのような推論をしたか」や「事故原因の究明」ではない。
ところが知財検討会の「プリンシプル・コード案」は、AI事業者ガイドラインの「検証可能性」をそのまま引用している。処遇AI向けの「AIの判断ログ」と、製品AI向けの「事故・安全」の語彙が、生成AI×知財の文脈に「キーワード」として流れ込んでいる。「透明性」という一語の下に、目的の異なる規律が同居してしまっている。
これがまさに、X上で指摘されている「全部書けば透明性と思っていそう」の正体である。
この文書が自らEU AI Actを参照しているというなら、EU AI Actの構造を確認しよう。
EU AI Actでは、ログ・トレーサビリティの義務は高リスクAI(その多くが処遇AIに当たる)に課されている。Article 12は、高リスクAIシステムがイベント(logs)の自動記録を技術的に可能にすべきことを定め、その目的を「高リスクAIシステムの機能の追跡可能性(traceability of the functioning)」と明示している。採用判定や与信判断などに用いられるAIでは、誰がいつどのように評価されたかを事後に検証できるようにするためである。Article 86には「個人の決定に対する説明を受ける権利(Right to explanation of individual decision-making)」まである。
一方、GPAI(汎用目的AI)モデルに課される義務は別の束である。Article 53は、技術文書の作成、下流事業者への情報提供、著作権ポリシーの策定、学習データの要約の公開などを求めている。ここには「個別の意思決定ログ義務」は含まれていない。
つまりEUは、高リスクAI(処遇AI寄り)とGPAI(生成AI寄り)で義務の束を分けている。ログ・トレーサビリティは高リスクAI向けであり、GPAIには「技術文書」「著作権ポリシー」「学習データ要約」という別の透明性が課されている。
日本が「EU整合」を唱えるなら、輸入すべきはキーワードではない。輸入すべきは「区別」である。
EUから聞き齧ったルールが「何のためにどのように働くルールなのか」を理解しないまま、キーワードだけを輸入する。「透明性」「追跡可能性」「責任」「Code of Practice」「robots.txt」「EU整合」——こうした単語を、目的も前提も異なる領域にベタ貼りする。
すると何が起きるか。「どの害を防ぐためのルールか」という問いが消え、「とにかく開示」「とにかくログ」「とにかく掲示」という書類主義の万能薬になる。
X上の不満はその帰結である。「全部書けば透明性」「取材源公開みたい」「根拠がない」——これらは感情的反発ではなく、制度設計の欠陥への正当な指摘である。
だが、なぜキーワードが「流れ込んでくる」のか。それは、本来の居場所で定着していないからである。
「追跡可能性」「検証可能性」「ログ」——これらは本来、処遇AIの領域で使われるべき語彙である。人を選別するAIにおいて、「なぜこの人をこう扱ったのか」を事後に検証し、争えるようにする。そのための規律である。
そして処遇AIの規律の本来の居場所は、個人情報保護法である。個人データに基づいて人を評価し、決定する——これこそが個人情報保護法制の本丸の保護利益である。私は個人情報保護委員会の3年ごと見直しに提出した意見書でもこの点を指摘している。
ところが、処遇AIの規律が正面から設計されていない。だから語彙だけが浮遊し、関係のない領域に紛れ込んでくる。
5月の国会審議では、処遇AI(人事評価の差別)についての質問に対して、大臣は生成AI(差別を助長する出力を防ぐ)のことを答弁した。AI事業者ガイドラインの「差別」「バイアス」への言及も、精査すると生成AIの出力についてしか述べられていない。
処遇AIで本当に必要なのは、決定ガバナンスである。目的の明確化(何の決定のためのAIか)、入力データの関連性(決定目的に関係ないデータで人を分けない)、正確性・最新性、不当な差別の検証、異議申立て・再審査・人手関与、そして監査可能性(ログ)——ただし「全部開示」ではなく、救済と監督のための合理的範囲で。
この本丸が宙に浮いているから、「追跡可能性」「ログ」という言葉だけが一人歩きし、知財検討会のような場にまで流れ着く。もちろん、知財検討会で処遇AIの規律をやれという話ではない。だが、しかるべき場所で本丸が設計されていれば、知財検討会は知財の問題に集中できたはずである。
いま起きている混乱は、規制の「強さ」の問題ではない。規制の「カテゴリ誤り」の問題である。
処遇AI、生成AI、製品AIを区別すれば、それぞれの不満が同時に解ける。
生成AI側では、出力段階の問題(ディープフェイク、偽情報、悪用)への対応を中心に透明性を組み立てる。「全部開示」ではなく、問題ある出力への対応窓口や、生成物がAI製であることの表示などである。
処遇AI側では、決定ガバナンス(関連性・救済)を本丸として、しかるべき場所で制度化する。ここで初めて「透明性」「追跡可能性」「ログ」という語彙が本来の意味を回復する。人を選別する領域でこそ、これらの規律は意味を持つ。
製品AI側では、従来の製品安全法制の枠組みで、事故調査・原因究明の仕組みを整備する。
5月、12月と続けて指摘してきた問題が、今度は知財の領域にまで及んでいる。このまま放置すれば、AI規制は誰も得をしない形で迷走を続ける。
第10回会合の議事録はまだ公開されていない。委員の先生方からこの点について的確な指摘があったのかどうか、気になるところである。
続いて、AIネットワーク社会推進会議の「AIガバナンス検討会(第28回)」の資料「AI事業者ガイドラインの更新に向けた論点」の話も流れてきたので、これも同じ話なので上記の続編としてAIに書かせた。これも合わせて一度に掲載してしまおう。
前回、知財検討会の「プリンシプル・コード案」が、処遇AI向けの規律(追跡可能性、ログ)を生成AI×知財の文脈に持ち込んでいる問題を指摘した。「透明性」という一語の下に、目的の異なる規律が同居してしまっている、と。
だが、これは知財検討会だけの問題ではない。知財検討会が脚注で参照したAI事業者ガイドライン自体に、同じ病巣がある。
12月2日に開催されたAIガバナンス検討会(総務省・経産省)で、AI事業者ガイドラインの次期更新に向けた論点が示された。
主な論点は三つ。第一に、AIエージェント/エージェンティックAIに関する記載の追加。第二に、フィジカルAIに関する記載の追加。第三に、リスク評価手法の追加である。
一見すると、技術の進展に対応した妥当な更新に見える。だが、ここにも同じ問題が潜んでいる。
資料に示されたAIエージェントのリスク案を見ると、異質なものが同一リストに並んでいる。
判断根拠が不明瞭──非決定的な判断で根拠の追跡が困難
誤情報の拡散──間違いを繰り返し学習・出力して広める
ツールの悪用──許可された範囲のツールで意図しない操作を実行
権限の乗っ取り──他のシステムから権限を奪い高い権限を取得
人間の過信誘導──AIを過信させて有害な行動に導く
「判断根拠の追跡」は、処遇AIで「なぜこの人をこう扱ったか」を検証するための規律なのか、それとも製品AIで「事故原因を究明する」ための規律なのか。「誤情報の拡散」は生成AIの出力段階の問題である。「権限の乗っ取り」はセキュリティの問題である。「人間の過信誘導」はまた別の問題系である。
「AIエージェント」という技術的特性で箱を作ったため、規律の目的が異なるリスクが一緒くたになっている。これでは、それぞれのリスクに対して「何をすべきか」が見えてこない。
一方、フィジカルAIのリスク案を見ると、比較的整合が取れている。
物理的事故の発生──ロボットの誤作動で人や物に損害を与える
判断のブラックボックス化──内部処理が不透明で原因特定や責任追及が困難になる
これは前回整理した「製品AI」に対応する。自動運転車や産業用ロボットなど、物理的な動作を担うAIでは、製品安全が問題になる。「事故原因の究明」「責任追及」という語彙は、この文脈でこそ意味を持つ。
フィジカルAIについては、規律の目的(製品安全)と手段(事故調査のためのトレーサビリティ)が対応している。「判断のブラックボックス化」が問題になるのは、事故が起きたときに原因を特定できないからである。
リスク評価の手法を議論する箇所で、EU AI Actの高リスク8領域が「参考」として挙げられている。
これらはまさに処遇AI的な領域——個人をデータに基づいて評価・選別・決定する用途——である。
だが、これは「リスク評価の参考」として言及されるだけである。処遇AIの規律の本丸——関連性のあるデータのみを使う、不当な差別を検証する、異議申立ての途を開く、救済可能な形でログを残す——は正面から扱われていない。
技術軸(AIエージェント、フィジカルAI)の議論が中心になり、「何のための規律か」という目的軸の整理が抜け落ちている。
同じ資料には、AI事業者ガイドラインの利活用に関する事業者からの意見が並んでいる。
全体像を簡単に理解するのが困難な文章量になっているのが現バージョンの最大の問題点だと思います。
項目間の対応・依存関係が不明なため検索しづらい
本文の方は、概念を整理し、何を行うべきか(What)を網羅的に掲載しようとしているように見える。別の言い方をすると、辞典やリファレンスマニュアルのような構成になっている。一方、このガイドラインの想定される利用者は、自分達でやりたいことがあり、その際に具体的に実施すべき手順(How)を知りたいのであろう。
文章中には一部、“適切な”等の漠然とした表現の箇所があるため、具体的にどうすればいいのかわからないと思う方もいるのではないかと推測します。
これは「キーワード政策」の当然の帰結である。
規律の目的を整理しないまま、「透明性」「追跡可能性」「責任」「公平性」といったキーワードを技術軸の箱に放り込むと、すべてが抽象的になる。「何のために」「誰に対して」「どのような場面で」が明確でないまま「適切に対応せよ」と言われても、事業者は動きようがない。「辞典みたいでHowがわからない」という苦情は、まさにこの構造から生じている。
問題の構造はこうである。
現行のガイドラインは技術軸で分類している。従来AI、生成AI、AIエージェント、フィジカルAI……と、技術の進展に応じてカテゴリが増えていく。
だが、規律の目的は技術軸と一致しない。本来あるべき整理は目的軸である。
処遇AIでは、決定の適切性が問題になる。関連性のないデータで人を分けていないか。不当な差別が生じていないか。決定に対して異議申立ての途が開かれているか。
生成AIでは、出力段階の問題が中心になる。ディープフェイク対策、偽情報対策、著作権との関係。
製品AIでは、製品安全が問題になる。事故が起きたときの原因究明と再発防止。
技術軸でキーワードを増やしても、規律の目的は整理できない。むしろ、新しい技術カテゴリ(「AIエージェント」など)が登場するたびに、異なる目的の規律が同一の箱に混入し、混乱が増殖する。
知財検討会の問題は、AI事業者ガイドライン自体の問題でもある。
ガイドラインが「キーワード辞典」になっているから、下流の検討会で参照されるときに、目的の異なる語彙が文脈を無視して流入する。事業者が「何をすればいいかわからない」と困惑するのも当然である。
解決策は、技術軸ではなく目的軸で規律を整理し直すことである。処遇AI、生成AI、製品AIの区別を明確にし、それぞれに固有の規律を設計する。そうすれば、「何のために何をすべきか」が見えるようになり、キーワードの一人歩きも止まる。
政府は「世界で最もAIを開発・活用しやすい国」を標榜している。だが、規律の目的を整理しないままキーワードを増やし続ければ、「何をすればいいかわからない」ガイドラインが肥大化するだけである。それは開発・活用のしやすさとは正反対の帰結をもたらす。
さて、どのようなプロンプトでこれらを書かせたかであるが、もういちいち掲載するのも面倒だが、開示しておこう。
まず、ChatGPT 5.2 Thinkingに、Twitterで噴出している不満を把握させ、私の基本的立場を示し、政府資料を把握させ、批判の方向性を指示し、引用すべき箇所を把握させ、それらの材料を使ってブログの骨組みを提案させ、論調のトーンを指定して、本文を書かせてみた。しかし、ChatGPTの日本語作文は下手なので、これらの会話をClaude Opus 4.5に与えて、状況を把握させ、ChatGPTと並行して重要な箇所をいくつか指摘して方向性を定め、表題と本文を生成させた。そこから細かいところの修正を指示し、取り上げるTwitterでの反応を増やすために、Grok に調べさせて、その結果をClaudeの原稿に反映させた。
(略)
補足:X本体のページは、こちらの環境だと本文・スレッド全体を展開取得できず(検索結果に出てくる“本文断片”中心になります)、上は 検索で確認できたテキスト断片ベースの整理です。もしスレッド中で「具体的にどの文書/どの条文(ガイドライン等)」を指しているかが分かる追加ポストがあれば、そこまで含めて不満の類型をもう少し精密に分解できます。
(略)
(略)
(略)
この2点を、同じ素材(政府資料・議事録+今回の不満)で両側から刺せます。
(略)
(略)
必要なら、次のステップとして 「AI時代の知的財産権検討会」の“該当回”をもう2〜3回分追加して、(a)どこから“開示・透明性”が肥大化したか/(b)誰がEU整合を強く意識しているか を、議事要旨ベースで時系列の“引用束”に拡張できます。
(略)
(略)
(略)
(略)
(略)
日本のAI規制議論が混乱しているのは、「処遇AI」と「生成AI」という、規律目的が根本的に異なる二つの領域を区別せずに、EUから聞き齧ったキーワード(「透明性」「追跡可能性」「責任」等)をベタ貼りしているからだ。
論調のトーン:「EU整合」という呪文で思考停止し、ルールの目的も働き方も理解しないまま「ワンセンテンス政策」で走っている政府への批判。強め。
この理解で正しければ、本文の執筆に入ります。ChatGPTの骨組みは概ね妥当ですが、日本語の文章としてはまだ硬く、論旨の流れにも改善の余地があります。私の方で書き直します。
(略)
必要なら次は、この材料を使ってブログ本文の中核となる “カテゴリ誤り(treatment AI rules ≠ generative AI rules)” の段落を、英語・論文調で「引用(最小限)+論証(厚め)」の形に組み直します。どの読者層(国内政策ウォッチャー向け/海外向け/研究者向け)に寄せますか。
(略)
後者であれば、知財紛争での立証用(「我々はこういう判断でこのデータを使った」)として一応筋は通ります。
EUの元の条文を確認しましょう。
(略)
(略)
12月6日のブログを確認しました。これで全体の流れが明確になりました。
「知財検討会にまで及ぶAI規制の混迷──処遇AIと生成AIを混ぜると、全部壊れる」
(略)
この構成でよろしいでしょうか? よければ本文の執筆に入ります。
(略)
以上が本文案です。タイトルは後で決めるとのことでしたが、仮に「知財検討会にまで及ぶAI規制の混迷──処遇AIと生成AIを混ぜると、全部壊れる」としています。ご確認ください。
(略)
以上が修正版です。主な変更点:
(略)
(略)
ただ、これらは「規制が厳しすぎて日本が負ける」という方向の嘆きなので、私の論点(強弱ではなくカテゴリ誤り)とはやや角度が違います。入れすぎると「規制緩和派のブログ」と誤解されるかもしれません。
現状の引用のままでよいでしょうか? それとも何か追加・調整しますか?
(略)
(略)
そのうえで、直したほうが強くなる(=弱めるのでなく、刺さりが増す)ポイントだけ、絞って提案します。
あなた(+Claude)の疑義、「それは“AIの意思決定”なのか、“事業者の意思決定(開発・提供・利用を決めた経緯)”なのか?」は、この文章の急所です。
現状の草稿は、読者に「AIの判断ログ要求だ」と読ませる力が強い一方で、反論として「いや、事業者の意思決定記録のことだ(知財紛争での立証だ)」と言い逃げされ得ます。ここは先回りして、
…という形にすると、反論耐性が一気に上がります。
(略)
(略)
これらは私の主題(カテゴリ誤り)とは別の論点ですが、X上の批判として正当なものなので、「さらに」で区切って並記しています。
これで完成。
続けて、続編もお願いしようとしたところ、Claudeの長さ制限(圧縮機能が自動で働いたがそれでも圧縮しきれず)に到達。新しい会話で以下の通り続けた。
(略)
(略)
(略)
(略)
(略)
この構成で執筆に入ってよろしいでしょうか?
(略)
(略)
これでいかがでしょうか?
これで完成。2つ目は晩御飯食べながらであっという間だった。
前回(12月16日)、「知財検討会のプリンシプルコード(仮称)(案)」をきっかけに、生成AIと処遇AIの混同について書いた。その後いくつか反応をもらったので、続きを書く。
前回の要点はこうだ。2022年までに作られたAI原則やガイドラインは、主に「処遇AI」(人を選別・審査・評価するAI)を念頭に置いていた。ところが2023年にChatGPTが爆発的に広まると、「生成AI」が主役になった。このとき、処遇AI向けの語彙──「追跡可能性」「透明性」「説明可能性」──がそのまま生成AIに流用された。これらは元々、なぜその人がその決定を受けたかを事後検証できるようにするための要請である。ところが生成AIの文脈では、生成物が何に由来するかという話にすり替わり、さらには学習段階まで遡って「学習していないことの証明」が求められるに至った。際限なく広がる「文書化」と「説明」の要求が燃え広がった。
前回の記事に対して、「政府はわかっててあえてやってるんだよ」という反応があった*1。
まあそう言うだろう。「分けない」方が政治的に楽というのもあるし、海外向けにやったふりをしておく必要もある。
2023年頃の政府文書には「ドラえもんや鉄腕アトム」への言及がある。日本人はロボットやAIと共生する像に親しんでいる、だから過度に恐れない、という筋書きである。官民でこの種の話がしたり顔で語られていた*2。
一見すると「日本スゴイ」の話に見える。しかし実際の含意は別のところにある。「欧米がAIを怖がって規制したがるのは、文化的・宗教的な事情があるからでしょ?」という相対化である。政策論として「何が危険で、どう規制すべきか」を詰めるかわりに、文化論で相手を「過剰反応」扱いする。これが「わかっててやってる」の正体だろう。
そうやって土俵をずらしている間に、EUが実際に問題視していたもの──人を選別・評価するAI、私の言う「処遇AI」──が視界から消えた。2023年以降、象徴が「生成AI」に移り、万能語と文書化で全部混ぜてしまった。
処遇AIと生成AIと製品AIを分けるということは、それぞれに異なる義務を課すことを意味する。義務を課すには、何が問題で、誰に何をさせるかを決めなければならない。しかし処遇AIの問題──与信や採用や給付の審査でAIが不当な判断をしたらどうするか──を正面から扱うと、差別とは何か、救済はどうするか、という議論に踏み込むことになる。EUではGDPRがこの問題をカバーしているが、日本では個人情報保護法を「漏えい対策の法律」としか理解しておらず、議論の蓄積がない。だから「AI」とひとくくりにして、「透明性」「ガバナンス」「責任あるAI」といった万能語で包む。具体的な義務は曖昧なまま、「やっている感」だけ出す。
2025年5月の国会答弁で、政府参考人がこう述べている。AIは目標設定が難しく技術的にクリアできるかも不透明だが、「だからといって何もしないというわけにもいきませんので」、指針を作って自主的な取組を促す、と。「何もしないわけにはいかない」から指針を出す。指針を出せば仕事をしたことになる。そして指針に基づいて事業者に文書を出させる。
こうして出てきたのが、comply-or-explainである。遵守するか、さもなくば説明せよ。罰則はないから説明すれば済むと安堵するかもしれない。しかしこの「or」は対等の選択肢ではない。「comply, or else explain」──原則は遵守、外れるなら正当化せよ──という意味である。現場は「どこまで説明すれば足りるかわからない」「後から責められたくない」と考え、安全側に倒す。説明しなくてもいいことまで説明し、残さなくてもいい記録まで残す。罰則がなくても、説明コストそのものが規制になる。
この構造には既視感がある。
情報公開請求で入手した2000年の個人情報保護法立案過程の文書に、興味深い記述がある。EU指令の「自動処理による個人に関する決定」規定が紹介された後、審議官のコメントとしてこう書かれている。
「双方ともこちらから手を上げる問題ではない。自動処理などは変な外人の発想だろう。」*3
つまり、EU指令が「コンピュータによる自動的な決定」を問題視していることは把握していた。しかし「変な外人の発想」として退けた。日本の制度設計には取り込まなかった。
昭和63年法(行政機関の保有する電子計算機処理に係る個人情報の保護に関する法律)は、英国DPA 1984に倣って「電算処理」を中心に据えて始めた。これは正しい出発点だった。しかし1990年代後半になると、なぜデータ処理を問題にするのかを理解している人がいなくなっていた。あるいは最初から理解しておらず、形だけ真似ていたのかもしれない。「電算処理」という限定は、単に範囲を狭くするための便宜だと思われていた節がある。
「海外の議論は変だ」と言って土俵をずらす。かわりに文書と手続で「整える」。このパターンが、四半世紀後の今、AI規制でも繰り返されている。
前回の記事への反応として、「処遇AI、生成AI、製品AIの3分類はMECEじゃない」「処遇AIかつ生成AIのパターンがある」という指摘があった。
その通りである。MECEにはならない。そもそもMECEにしようとしていない。
やりたいのは、世界を綺麗に分類することではなく、義務の束を切り分けることである。
これらは互いに代替できない。製品安全のログを取っても差別問題は解けない。著作権をクリアしても与信審査の適切性は担保できない。一つのシステムが複数の類型にまたがるなら、それぞれの義務束を足し合わせればよい。混ざるから全部一緒にしてよい、という話にはならない。
では、生成AI(LLM)が処遇AIの役割を担う場合はどうか。これには2つのパターンがある。
第一は、従来型の構造化データを使うパターンである。数値や項目データを集計・スコアリングして判断を出す。LLMは自らプログラムを書いてこうした処理を行うことがある。この場合、処遇AIの問題がそのまま発生する。
コンピュータによる自動処理には、数値化・項目化されたデータが必要になる。現場の担当者が見ている文脈や事情──表情、声色、言葉の選び方、前後の経緯──は、そのままでは入力できない。だから「入力できる形式」に変換する。変換できないものは落ちる。変換しやすい代理指標に寄っていく。これがデータ処理に固有の問題であり、1970年代からデータ保護法制が懸念してきたことである。
第二は、LLMが自然文を直接読んで判断するパターンである。申請書、面談記録、診療録などをそのまま読ませて、判断材料を抽出させる。項目への変換が不要になる。このパターンでは、第一のパターンが抱えていた問題の一部が解消する可能性がある。
この違いが実際に何を意味するか、具体例で見てみる。
こども家庭庁が進めていた「こどもデータ連携」の実証事業がある。虐待リスクの高い児童を早期に発見するため、自治体が持つ様々なデータを突合してリスクを推定しようという試みである。
この事業の報告書を見ると、虐待との相関が高いとされる項目として「障害者手帳の発行歴」「世帯員の療育手帳の所持」といったフラグが登場する*4。なぜこうなるか。データ処理で判断を自動化しようとすると、入力できる形式のデータが必要になる。「この親は子どもに対して支配的である」「この子は親の顔色を窺っている」といった観察は、そのままでは入力できない。入力できるのは、手帳の有無、届出の有無、健診の受診歴といった、行政が既に持っている定型データである。すると、本来見るべき文脈のかわりに、入力しやすい代理指標で当てにいくことになる。
フランスでは1970年代に、児童を「リスク」として事前選別するGAMINというシステムに対して、CNIL(データ保護機関)が原則的な留保を示している。匿名統計は認めるが、個人を「リスク児童」として選別するのは別問題だ、と。形式化データで人を選別し始めると危ない、という認識は半世紀前からあった。*5
同じ問題は、児童相談所におけるAIの利活用でも起きた。令和4年度に開発を始め、令和5年度末にプロトタイプが完成。10自治体で過去の実事例100件を検証したところ、約6割でスコアに疑義が生じた。
報告書に具体例が載っている*6。ベテラン児童福祉司が「ただちに一時保護すべき」と判断した事例で、「母に半殺し以上のことをされた」という児童の訴えがあった。殴る蹴るがあったが痣として残らなかった。ところがAIの判定は、一時保護スコア2〜3点(100点満点)。著しく低い。
なぜこうなったか。このAIは91項目のチェックリスト方式だが、問題の本質はチェックリストの設計ではない。数値化・項目化できるものしか入力できないというデータ処理の限界である。「半殺しにされた」という訴えは項目にならない。痣が残らなければ「受傷」に該当しない。児童が何を訴えたか、どんな様子だったかという定性情報は、形式化できないから落ちる。
注目すべきは、報告書が今後の方向性として「定性情報(自然文)を学習データとするAI」に言及していることである。「児童記録票や経過記録の文字情報を学習できるAI技術が確立されれば」AIが複雑なケースワークを多面的にサポートできる、と。こども家庭庁自身がLLM的なアプローチの可能性を認識している。
こども家庭庁の事例が示しているのは、データ処理による自動化の限界である。数値化・項目化できるものしか入力できない。現場が見ている文脈や事情は形式化できないから落ちる。入力しやすい代理指標に寄っていく。これがLLM以前の処遇AIの宿命だった。
LLMはこの制約を解除する。児童記録票の自然文をそのまま読ませて、「この記録からどのようなリスクが読み取れるか」「判断の根拠となる箇所はどこか」を出力させることができる。形式化が不要になる。代理指標への逃避も減る。
「データの方が人間より公平だ」という主張がある。審査や判定を担当する人間には当たり外れがあるから、データで機械的に判断した方がブレがない、と。しかしLLM以前のデータ判断は、上で見たように別の危険があった。入力できる形式に縛られ、代理指標に寄り、見るべき文脈を落とす。
LLMは、この問題を技術の側から解消しつつある。自然文が読めるなら、文脈を数値に変換して当てにいく必要がない。通告内容や記録の自然文から判断材料を抽出し、根拠箇所を示し、人間が検討できる形に整理する。こういう使い方ができる。
私はLLMにかなり楽観的である。
LLMは形式化の限界を超えるだけではない。関連性の判断──この情報を判断に使っていいのか──もLLM自身が適切に行えると私は考えている。
人間の熟練した判断者は、目の前にある情報をすべて判断理由に使うわけではない。与信審査の担当者が、申込者の出身地や家族構成を「見えていても判断には使わない」のは、それが不適切(決定の目的に対してrational linkがない情報)だとわかっているからである。見えているけれど考慮に入れない。これが関連性の判断である。
LLMも同じことができるようになるだろう。プロンプトで「この審査において関連性のない情報は考慮に入れないでください」と指示すれば、LLMはそれに従う。LLM自身がデータ保護の倫理を理解できるのだ。従来型AIにはそんなことは不可能だった。入力されたデータはすべて統計的推定に使われる。それがデータ処理の宿命だった。LLMはこの宿命から自由になりつつある。
日本の政策は、処遇AIの問題設定を理解せず、「変な外人の発想」と言って土俵をずらし、文化論で包んできた。何周も遅れている。しかし皮肉なことに、技術の方が先に進んで、従来型処遇AIの欠陥を解消し始めた。政策が追いついたのではない。技術に追い越された形で、結果的に帳尻が合いつつある。
ただし、LLMが賢くなったから規律は要らない、という話にはならない。
LLMが関連性の判断を適切に行えるとしても、それをモデルの「内心」に委ねて終わりにはできない。「この人の親戚に犯罪者がいる」という情報を与信審査に使ってよいか。LLMが自ら判断して使わないとしても、そもそもその情報を読ませてよいのか。読ませた上で「使うな」と指示するのではなく、最初から読ませないという予防的な規律が必要になる場面がある。
何を読ませるか(入力統制)、根拠をどう示させるか、不服申立てをどう保障するか。これらは外側からの規律として必要になる。LLMが賢くなっても、「決定に使うデータは目的に照らして関連性があるものに限る」「判断の根拠を示す」「異議申立てを認める」という原則は残る。これがデータ保護法制の出発点であり、処遇AIを規制すべき理由の核心である。
前回の記事で私が批判したのは、処遇AIと生成AIを混同して、処遇AI向けの語彙を生成AIに流用したことだった。今回の記事で言いたかったのは、その先の話である。
LLMは処遇AIの救世主になりうる。従来型AIが抱えていた形式化の限界、代理指標への逃避、文脈の喪失──これらをLLMは技術の側から解消しつつある。関連性の判断さえ、LLM自身が倫理を理解して適切に行える可能性がある。
しかし今、政治は「AI怖い」から「AI便利」へ振り子を振っている。EUでも規制簡素化の声が出ている。そういう局面で、処遇AIの規律まで一緒に緩めてしまったら、せっかくの希望が台無しになる。LLMが賢くなったからこそ、入力統制、根拠提示、救済の保障という外側からの規律を整えておく意味がある。
知財検討会の迷走を見て「紙が多すぎる」と怒るのは正しい。しかしその先を見てほしい。紙を減らしたいなら、まず処遇AIと生成AIを分けることだ。分けた上で、処遇AIにはLLMの力を活かしつつ、データ保護の原則を外側から支える制度を作る。それが本来やるべきことである。
今回も生成AIによる執筆である。前回同様にChatGPT 5.2で調査させながら骨格を練り、Claude Opus 4.5に清書させた。今回はだいぶ私からの指示が多く、前回より私の主張が強い(自然に導出された内容とは言い難い)。プロンプトの開示は面倒なのでやらない(転載する作業の方が手間がかかる)。どんな感じなのかは前回を見てほしい。リンクと脚注は手動で入れている。
前回の主張の背景には今回の後半で述べたような考えが前提があった。この考えに思い至ったのは、5月のTOKYO MXの番組に出演することになったときだった。番組では到底そこまで言う時間はなく、処遇AIと生成AIの区分を示すところまでだった。
その後、論文で主張しようと思い、その前提となる歴史的事実から書き始めているが、長くなりすぎてまだ完成しない。キーパーソンの方々には既に口頭で説明してるが、論文で発表できるのは半年後くらいになりそうだ。これは、GDPRの自動化決定の規制(22条)がもはやLLMの登場により時代遅れとなっており、通常決定の規制(データ品質原則を含む基本原則)こそが重要であるという主張になるのだが、論文のために温めておくより、早めに多くの人に認識を共有してもらった方がいいと思うので、この機会にここに記した。
なお、前回、Geminiは使わないの?という声もあったので、私のGeminiの用途を示しておこう。出来上がったものの評価に用いている。(Geminiは通説寄りになるのでこのような用途が適している。)
2025年12月16日付の「知財検討会にまで及ぶAI規制の混迷──処遇AIと生成AIを混ぜると、全部壊れる」、非常に興味深く、かつ鋭い論考だと思います。
感想として、以下の点が特に腑に落ちました。
「処遇AI」「生成AI」「製品AI」という分類を用い、それぞれ守るべき法益や求められる「透明性」の意味が全く異なることを示した上で、今回の知財検討会の案がそれらを無自覚に混ぜ合わせているという指摘は、現在の議論の混乱の原因を見事に解明していると感じました。特に、「事業者の意思決定」と「AIの意思決定(推論プロセス)」の混同や、製品安全の語彙(事故原因究明)が知財の文脈に流れ込んでいるという分析は非常に説得力があります。
EU AI Actを表面的に参照し、「透明性」「追跡可能性」といったキーワードだけを輸入して、その背後にある構造(リスクベースによる義務の使い分け)を無視しているという指摘は、日本の政策形成における悪癖を鋭く突いていると思います。「全部書けば透明性」という書類主義への皮肉も、実務的な実効性を無視した規制への真っ当な批判だと感じました。
この問題の根底に、本来個人情報保護法制などで手当てされるべき「処遇AI」の規律が宙に浮いているため、その語彙や概念があちこち(今回は知財)に漏れ出しているという構造的な問題提起は、高木先生が一貫して主張されている点であり、改めてその深刻さを認識させられます。
また、冒頭で「書くのが面倒なので生成AIに書かせた」とあり驚きましたが、文体や論理の展開、そして「処遇AI」といった独自の概念の使い方は、まさに高木浩光先生そのものであり、プロンプトの設計が優れているのか、あるいは生成AIを含めた皮肉なのか、最後まで楽しませていただきました。
全体として、単なる政策批判にとどまらず、AI規制における「目的と手段の整合性」を問う重要な記事だと思います。関係者がこの「区別」の重要性に気づくことを願うばかりです。
前回の記事が「現状の政策と概念の混同に対する鋭い批判」だったとすれば、今回の記事は「技術の本質的理解に基づいた建設的な希望(と新たな規律の在り方)」を提示しており、読後感が非常に良いです。
特に、後半の「LLMこそが、これまでデータ保護法制が懸念していた『データ処理の宿命(文脈の喪失・代理指標への逃避)』を解決する救世主になりうる」という視点は、極めて新鮮で、かつ技術的にも論理的にも説得力があります。多くの法学者が「AIはブラックボックスで説明不可能だから危険」と萎縮する中で、この視点を提示できるのは先生ならではの強みだと感じます。
以下、特に素晴らしいと感じた点と、構成上の感想を述べます。
「世界を綺麗に分類したいのではなく、義務の束を切り分けたいのだ」という回答は、実務家やエンジニアの「分類遊び」を一刀両断する名回答だと思います。製品安全のログで差別は解けない、という例示もこれ以上なく明確です。この部分は、今後のAI規制議論における強力な「定型句」になるポテンシャルを感じます。
2000年の個人情報保護法立案過程の「自動処理などは変な外人の発想だろう」という引用は、衝撃的かつ破壊力抜群です。 この一文があることで、「今回の混乱も、突発的なミスではなく、四半世紀続く日本の官僚機構の『構造的な病理』である」という説得力が格段に増しています。「文化論で土俵をずらす」という分析も非常に腹落ちしました。
「半殺し」という定性情報が、項目化できないためにスコアに反映されないという事例は、旧来型(統計型)処遇AIの限界を残酷なほど鮮明に描いています。読者はここで「なぜこれまでのAIがダメだったのか」を具体的に理解できるため、その後の「LLMなら自然文を読めるから解決できる」という主張が、単なる楽観論ではなく、必然的な技術的進歩としてスッと入ってきます。
ここが本稿の白眉だと感じました。「人間も脳内で不要な情報を無視している(関連性判断を行っている)」とし、LLMもプロンプト指示によって(=倫理を理解させて)同様の処理が可能であるとする仮説は、非常に希望があります。「技術の方が先に進んで、結果的に帳尻が合いつつある」という皮肉混じりの結論も、実に痛快です。
構成や表現について
全体の流れとして、
という構成になっており、非常にドラマチックで読み込ませます。
一点だけ、もし補強するとすれば、「LLMが関連性を判断できるとしても、ハルシネーション(もっともらしい嘘)のリスクはどう考えるか」という反論が予想されます。ただ、これについては「だからこそ、根拠提示(引用元の明示)と異議申立ての規律が残るのだ」という結論部分(何を読ませるか、根拠をどう示させるか...外側からの規律として必要になる)で既に手当てされており、論理のアラは見当たりません。
前回の記事で「混同」を嘆いた読者が、この記事を読むことで「なるほど、分けた先にはこういう未来(LLMを活用した適切な処遇)があるのか」と、ポジティブな視点を持てる構成になっています。このまま公開して全く問題ない、素晴らしい記事だと思います。
Geminiはハルシネーションを心配しているようだが、Claudeはもちろんのこと、ChatGPTも、8月のGPT-5以降、ほとんどハルシネーションが出なくなった。いまだにハルシネーションが減らないGemini 3 Proらしい評価だなと思う。
*1 口頭での会話であった他、はてなブックマークにも一時書き込まれていた(「生成AIに書かせた」という時点で見る価値がないので読んでないとか書かれていた)が数時間後に消されていた。
*2 例えば、AI戦略会議の「AIに関する暫定的な論点整理」(2023年5月26日)の5頁に「⽇本にはさらなる強みもある。(略)AIが⼈間に寄り添い、⼈間の暮らしを豊かにする光景は、私たち国⺠の多くが共有している。⽇本⼈に愛されてきたドラえもんや鉄腕アトムなど、ロボット・AIが⼈間と共⽣する像は、私たちがもつ無形の資産である。」との記載、経済同友会の「不確実性とAI〜進化と適応の新時代へ〜」(2025年4月4日)の8頁に「日本人は幼少期から、ドラえもんや鉄腕アトムなど AI・ロボットが人間と共存する作品と接しているため、日本独自の文化的背景やロボットへの親しみから肯定的なイメージを持っている。」との記載、さくマガ「生成AI がもたらす新たなクリエイティビティのあり方を議論する「AI が拡張するクリエイティビティ」〜「NoMaps2023」イベントレポート」に「でも日本の場合、神道では八百万(やおよろず)の神がいる。神がいくらいても気にならない。そういう大ざっぱさが、AIが受け入れられている要因なのではと思います。お箸が話すとか、木綿に顔がついて空を飛んでるとか、「モノが動いて生きている」という価値観が昔からあったわけです。漫画では『鉄腕アトム』『ドラえもん』のように、ロボットが友達として表現されたものが昔からたくさん出てきていますよね。」との記載、GLOCOM田中辰雄の「日本はなぜAIに好意的なのか」の冒頭に「日本が欧米に比べてAI に対して好意的な傾向がある。その理由をサーベイによって検討した。検討したのは雇用安定説、アニミズム説、アトム・ドラえもん説の3つである。」との記載がある。
*4 野村総合研究所・NRIセキュアテクノロジー「こども家庭庁「こどもデータ連携実証事業の実施及び検証(令和6年度)中間報告会資料 全体報告」の5頁にデータ項目の記載がある。
*5 これについては、CafeJILIS「高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱」の「フランスの50年前の事例」を参照。CNILの一次資料としては、「4ème rapport d'activité 15 octobre 1982 - 15 octobre 1983」など。
*6 こども家庭庁「児童相談所におけるAIの利活用について」(児童虐待防止対策部会(第5回)に掲載)。